Tài liệu Nhận dạng cá nhân trong hình ảnh của mục tin dựa vào phân tích văn bản
9 trang |
Chia sẻ: honghanh66 | Lượt xem: 681 | Lượt tải: 0
Bạn đang xem nội dung tài liệu Nhận dạng cá nhân trong hình ảnh của mục tin dựa vào phân tích văn bản, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Nhòn ra thïë giúái
28 THÖNG TIN vaâ TÛ LIÏÅU - 2/2012
1. Múã àêìu
Àïí tùng thïm hònh aãnh vaâ cung cêëp
cho ngûúâi àoåc taâi liïåu minh hoåa, phêìn lúán
website tin tûác thûúâng àûa vaâo baâi muåc caác
nöåi dung àa phûúng tiïån gùæn vúái hònh aãnh
vaâ video clip. Möåt trong nhûäng muåc tiïu vaâ
thaách thûác trong viïåc tòm hònh aãnh laâ phaãi
nhêån daång àuáng vaâ tòm àûúåc hònh aãnh cuãa
caá nhên cuå thïí tûâ böå sûu têåp hònh aãnh lúán.
Nhûäng cöng trònh nghiïn cûáu trûúác àêy
vïì nhêån daång con ngûúâi trong caác hònh aãnh
thûúâng dûåa vaâo hai caách tiïëp cêån khaác
nhau: nhêån mùåt vaâ tòm chó muåc. Nhêån mùåt
dûåa vaâo möåt söë kyä thuêåt xûã lyá hònh aãnh àïí
xêy dûång vaâ nhêån biïët caác àùåc àiïím tûâ hònh
aãnh böå mùåt [16]. Vúái möåt loaåt caãi tiïën àûúåc
thûåc hiïån trong nhiïìu nùm qua, nhêån mùåt
àaä àûúåc aáp duång thaânh cöng trong nhiïìu
ûáng duång nhû trùæc lûúång sinh hoåc vaâ àiïån
tûã hoåc tiïu duâng (vñ duå, maáy aãnh söë). Tuy
nhiïn, aáp duång nhêån daång mùåt trong lônh
vûåc tòm hònh aãnh ngûúâi coá möåt söë haån chïë
vò nhûäng lyá do sau àêy: (1) taách ra vaâ biïët
àûúåc caác àùåc àiïím vïì hònh tûâ caác hònh aãnh
àoâi hoãi rêët nhiïìu thúâi gian xûã lyá; (2) àïí
nhêån ra tûâng caá nhên cuå thïí àoâi hoãi phaãi coá
möåt kñch cúä mêîu hònh mùåt thñch húåp, do
àoá, caách tiïëp cêån naây khöng àûúåc múã röång
nhiïìu khi xûã lyá möåt söë lûúång lúán caá nhên
vaâ (3) kyä thuêåt nhêån mùåt àún giaãn khöng
àuã maånh àïí nhêån daång con ngûúâi tûâ nhûäng
goác nhòn khaác nhau vaâ trong nhûäng hònh
aãnh àöå phên giaãi thêëp.
Àïí giaãi quyïët quy mö lúán cuãa Web,
nhiïìu maáy tòm hònh aãnh àaä chêëp nhêån caách
tiïëp cêån tòm theo chó muåc àang àûúåc
aáp duång thaânh cöng cho viïåc tòm trang
web [8]. Pheáp tòm theo chó muåc àiïín hònh
laåi dûåa vaâo mö thûác tuái tûâ àïí xaác àõnh cêëu
truác chó muåc àaão, nghôa laâ, möîi thuêåt ngûä seä
chó túái möåt danh saách tû liïåu coá chûáa thuêåt
ngûä àoá. Theo mö thûác tuái tûâ, möåt tû liïåu coá
chûáa cêu hoãi àêìu vaâo úã bêët kyâ chöî naâo trong
nöåi dung àïìu àûúåc coi laâ truáng àñch vaâ seä
àûúåc phaãn höìi cho ngûúâi sûã duång.
Àöëi vúái pheáp tòm hònh aãnh, möåt chó muåc
coá thïí àûúåc xêy dûång tûâ nhiïìu mêíu thöng
tin vùn baãn nhû tïn file aãnh, caác lúâi thuyïët
minh gùæn liïìn vúái hònh aãnh vaâ caác àoaån vùn
baãn liïìn kïì vúái hònh aãnh [6].
Noái chung, sûã duång pheáp tòm theo chó
muåc cho caác hònh aãnh trïn Web laâ hûäu
hiïåu. Tuy nhiïn, tòm hònh aãnh cuãa caác caá
nhên cuå thïí trong lônh vûåc tin tûác àöi khi
coá thïí àûa ra kïët quaã khöng mong muöën.
Vúái mö thûác tuái tûâ àún giaãn, möåt cêu hoãi
tòm möåt ngûúâi coá thïí tûúng ûáng vúái möåt
vaâi muåc tin (nghôa laâ ngûúâi àoá àûúåc noái túái
trong nhiïìu tin) maâ hònh aãnh cuãa caác muåc
àoá coá caã aãnh cuãa nhûäng ngûúâi khaác. Do àoá,
nhûäng hònh aãnh khöng tûúng thñch àöi khi
cuäng àûúåc àûa ra cho ngûúâi sûã duång cuâng
vúái hònh aãnh àuáng cuãa caá nhên muåc tiïu.
Chuáng töi xin minh hoåa vêën àïì naây bùçng
caách sûã duång möåt vñ duå tûâ Pheáp tòm hònh
aãnh tin tûác theo Google11 dûåa trïn phûúng
phaáp tiïëp cêån tòm theo chó muåc. Hònh 1 cho
NHÊÅN DAÅNG CAÁ NHÊN TRONG HÒNH AÃNH CUÃA MUÅC TIN
DÛÅA VAÂO PHÊN TÑCH VÙN BAÃN
Choochart Haruechaliyasak vaâ Chaianun Damrongrat
Trung têm Quöëc gia Cöng nghïå Àiïån tûã vaâ Maáy tñnh Thaái Lan
1 Google News,
Nhòn ra thïë giúái
THÖNG TIN vaâ TÛ LIÏÅU - 2/2012 29
thêëy kïët quaã tòm bùçng caách sûã duång
“Barack Obama” laâm cêu hoãi. Tûâ caác kïët
quaã naây, hún möåt nûãa söë hònh aãnh phaãn höìi
khöng coá hònh aãnh cuãa“Barack Obama”.
Theo quan saát ban àêìu cuãa chuáng töi,
möåt muåc tin thûúâng chûáa hònh aãnh cuãa caá
nhên muåc tiïu nïëu tïn cuãa ngûúâi àoá xuêët
hiïån nhû chuã ngûä chñnh trong caác cêu khaác
nhau cuãa muåc tin, vñ duå trong àêìu àïì vaâ
chuá thñch hònh aãnh. Hònh 2 laâ vñ duå vïì möåt
muåc tin lêëy tûâ website tin tûác cuãa CNN2 coá
chûáa hònh aãnh cuãa möåt caá nhên vúái àêìu àïì
vaâ chuá thñch hònh aãnh. Tûâ hònh naây, hai
thûåc thïí tïn ngûúâi “Hillary Clinton” vaâ
“Barack Obama” xuêët hiïån trong caã àêìu
àïì lêîn chuá thñch hònh aãnh. Khi sûã duång
pheáp tòm theo chó muåc àún giaãn, möåt cêu
hoãi tòm “Barack Obama” coá thïí seä àûa
nhêìm hònh aãnh naây cuãa “Hillary Clinton”.
Muåc àñch chñnh cuãa baâi naây laâ caãi tiïën
hiïåu suêët cuãa pheáp tòm theo chó muåc cú baãn
àïí tòm àûúåc caác caá nhên trong caác hònh aãnh
tin tûác. Caách tiïëp cêån cuãa chuáng töi laâ aáp
duång phên tñch cuá phaáp vïì nöåi dung vùn
baãn (vñ duå, caác àêìu àïì vaâ chuá thñch hònh
aãnh) àïí nhêån daång khùèng àõnh vaâ phuã àõnh
caá nhên trong caác hònh aãnh tin tûác. Pheáp
phên tñch cuá phaáp trong phûúng phaáp cuãa
chuáng töi bao göìm viïåc àõnh nhaän thûåc thïí
coá tïn vaâ phên tñch cuá phaáp sú böå [1, 3]. Tûâ
Hònh 2, bùçng caách thûåc hiïån phên tñch àêìu
àïì tin, “Clinton” seä àûúåc phên tñch vaâ àõnh
nhaän nhû laâ möåt cuåm danh tûâ (NP), sau àoá
“chêëp nhêån” nhû möåt cuåm àöång tûâ (VP) vaâ
“Obama” nhû laâ möåt cuåm danh tûâ (NP)
Hònh 1. Kïët quaã tòm “Barack Obama” theo pheáp tòm hònh aãnh tin tûác trïn Google
2 CNN.com International ,
Nhòn ra thïë giúái
30 THÖNG TIN vaâ TÛ LIÏÅU - 2/2012
Tûâ cêu naây, coá thïí ruát ra hai quy
tùæc: (1) [NP*] [VP] [NP] àïí nhêån daång
khùèng àõnh ngûúâi trong caác hònh aãnh :
vaâ (2) [NP] [VP] [NP*] àïí nhêån daång phuã
àõnh, trong àoá dêëu * chó võ trñ xuêët hiïån tïn
ngûúâi. Quy tùæc nhêån daång khùèng àõnh coá
nghôa laâ: nïëu tïn ngûúâi àoá xuêët hiïån nhû
möåt cuåm danh tûâ vaâ laâ chuã ngûä cuãa möåt cêu
thò hònh aãnh naây chùæc chùæn coá chûáa ngûúâi
muöën tòm. Ngûúåc laåi, quy tùæc nhêån daång
phuã àõnh coá nghôa laâ: nïëu tïn ngûúâi naây
xuêët hiïån nhû möåt cuåm danh tûâ vaâ laâ tên
ngûä cuãa möåt cêu thò hònh aãnh naây khöng
chùæc chùæn chûáa ngûúâi muöën tòm.
Sûã duång têåp húåp muåc tin coá àõnh nhaän,
chuáng ta xêy dûång àûúåc möåt böå quy tùæc cuá
phaáp dûåa vaâo nhûäng yá tûúãng noái trïn. Sau
àoá, böå quy tùæc cuá phaáp àûúåc sûã duång àïí lûåa
choån vaâ saâng loåc caác kïët quaã hònh aãnh do
pheáp tòm theo chó muåc àem laåi. Tûâ vñ duå
trïn, cêu hoãi “Obama” seä tòm ra hònh aãnh
tûâ Hònh 2, tuy nhiïn, hònh aãnh naây seä àûúåc
loåc ra bùçng caách sûã duång quy tùæc nhêån
daång phuã àõnh [NP] [VP] [NP*] vò
“Obama” xuêët hiïån nhû laâ NP* trong cêu.
Kïët quaã thñ nghiïåm vïì têåp húåp hònh aãnh tin
tûác cho thêëy, caách tiïëp cêån phên tñch cuá
phaáp coá thïí caãi thiïån möåt caách àaáng kïí
hiïåu suêët tòm kiïëm àöëi vúái pheáp tòm theo
chó muåc cú baãn.
2. Caác cöng trònh nghiïn cûáu liïn
quan
Caác cöng trònh nghiïn cûáu trûúác àêy vïì
tòm kiïëm hònh aãnh chuã yïëu dûåa vaâo hai kyä
thuêåt khaác nhau : tòm hònh aãnh dûåa vaâo vùn
baãn vaâ dûåa vaâo nöåi dung (CBIR) [4]. Caách
tiïëp cêån dûåa vaâo vùn baãn cùn cûá vaâo thöng
tin vùn baãn kïët húåp vúái hònh aãnh àïí khúáp
möåt cêu hoãi àêìu vaâo, göìm möåt hay nhiïìu
tûâ, vaâo caác hònh aãnh. Do khaã nùng tuây biïën
kñch cúä, caách tòm hònh aãnh dûåa vaâo vùn baãn
àaä àûúåc aáp duång phöí biïën úã nhiïìu maáy tòm
Àêìu àïì: Clinton hêåu thuêîn cho Obama, kïu goåi sûå thöëng nhêët trong Àaãng
Hònh 2. Vñ duå vïì hònh aãnh möåt caá nhên vúái àêìu àïì vaâ chuá thñch hònh aãnh
Chuá thñch : Thûúång nghõ syä Hillary Clinton caãm ún nhûäng ngûúâi uãng
höå baâ vïì baâi diïîn vùn hêåu thuêîn cho Thûúång nghõ syä Barack Obama
Nhòn ra thïë giúái
THÖNG TIN vaâ TÛ LIÏÅU - 2/2012 31
nhû Google 3 vaâ Yahoo 4 . Mùåt khaác, CBIR
aáp duång kyä thuêåt xûã lyá hònh aãnh àïí taách ra
vaâ biïët àûúåc caác àùåc àiïím hònh tûâ caác hònh
aãnh . Trong caác hïå thöëng CBIR, möåt cêu
hoãi vïì hònh, mö taã caác àùåc àiïím hònh nhû
maâu sùæc vaâ kïët cêëu, àûúåc duâng àïí tòm ra
hònh aãnh tûúng ûáng töët nhêët vúái caác àùåc
àiïím àêìu vaâo [7, 12].
Vúái söë lûúång lúán hònh aãnh trïn Web coá
chûáa aãnh cuãa caác caá nhên, àïì taâi nghiïn
cûáu vïì tòm kiïëm hònh aãnh phuåc vuå cho viïåc
tòm hònh aãnh ngûúâi àaä ngaây caâng àûúåc chuá
yá. Trong caách tòm hònh aãnh ngûúâi, nïëu àùåt
cêu hoãi tòm möåt tïn ngûúâi cuå thïí, muåc àñch
laâ phaãi tòm àûúåc chñnh xaác caác hònh aãnh
cuãa ngûúâi àoá (ûu tiïn laâ aãnh caá nhên) tûâ böå
sûu têåp hònh aãnh lúán (vñ duå, tûâ caác website
tin tûác). Kyä thuêåt tòm hònh aãnh ngûúâi tûúng
tûå nhû caác kyä thuêåt àûúåc sûã duång àïí tòm
kiïëm hònh aãnh noái chung. Caách tiïëp cêån
dûåa vaâo nöåi dung, vaâo kyä thuêåt nhêån mùåt
àïí xêy dûång vaâ biïët caác àùåc àiïím hònh tûâ
hònh aãnh böå mùåt. Rêët nhiïìu cöng trònh
nghiïn cûáu trûúác àêy vïì tòm kiïëm hònh
aãnh ngûúâi àïìu dûåa vaâo kyä thuêåt nhêån
mùåt [2,9,10,11]. Chuáng àaä aáp duång caác
biïën thïí cuãa kyä thuêåt nhêån mùåt àïí liïn kïët
caác hònh aãnh mùåt vúái tïn ngûúâi àûúåc tòm
thêëy trong caác muåc tin. Nhû àaä noái úã trïn,
aáp duång kyä thuêåt nhêån mùåt khöng coá nhiïìu
khaã nùng nêng cúä tuây biïën vò coá nhiïìu
ngûúâi trong caác tin tûác. Do àoá, cêìn coá möåt
kñch cúä mêîu lúán cuãa hònh aãnh mùåt cho möîi
caá nhên. Ngoaâi ra, viïåc taách ra vaâ nhêån biïët
caác àùåc àiïím hònh tûâ hònh aãnh mùåt àoâi hoãi
nhiïìu thúâi gian xûã lyá.
Àïí tùng khaã nùng nêng cúä tuây biïën,
nhiïìu cöng trònh nghiïn cûáu àaä aáp duång
caách tiïëp cêån dûåa vaâo vùn baãn àïí tòm ngûúâi
trong caác muåc tin tûác. Sihari [13] àaä àûa ra
hïå thöëng goåi laâ Piction, duâng caác chuá thñch
aãnh àïí nhêån daång tûâng caá nhên tûâ möåt hònh
aãnh coá chûáa nhiïìu ngûúâi. Hïå thöëng naây kïët
húåp thuêåt toaán àõnh võ mùåt trong hònh aãnh
vúái möàun NLP àïí phên tñch võ trñ khöng
gian cuãa caá nhên tûâ chuá thñch hònh aãnh.
Yagnik vaâ Islam [14] àaä àûa ra phûúng
phaáp dûåa vaâo nhêån biïët sûå àöìng xuêët hiïån
cuãa vùn baãn vaâ hònh aãnh trïn Web. Caách
tiïëp cêån naây goåi laâ nhêån biïët nhêët quaán,
thûúâng duâng àïí chuá giaãi hònh aãnh ngûúâi.
Yang vaâ Hauptmann [15] àûa ra phûúng
phaáp nhêån biïët thöëng kï àïí nhêån daång möîi
caá nhên xuêët hiïån trong bùng video truyïìn
hònh dûåa vaâo vùn caãnh tòm thêëy trong caác
baãn sao cheáp video. Edwards vaâ nhûäng
ngûúâi khaác [5] aáp duång phûúng phaáp phên
nhoám vùn baãn àïí têåp húåp hònh aãnh ngûúâi
vaâo möåt söë nhoám chuã àïì. Möåt söë quan saát
vïì cêëu truác cuá phaáp tïn ngûúâi trong caác chuá
thñch hònh aãnh àaä àûúåc baân àïën vaâ sûã duång
trong caác thñ nghiïåm.
Phêìn àoáng goáp chñnh cuãa chuáng töi laâ
àûa ra caách tiïëp cêån coá hiïåu lûåc vaâ coá khaã
nùng nêng cúä tuây biïën tûå àöång xêy dûång böå
quy tùæc cuá phaáp àïí nhêån daång caá nhên
trong caác hònh aãnh tin tûác. Caác quy tùæc naây
àûúåc sûã duång àïí choån lûåa vaâ saâng loåc caác
kïët quaã hònh aãnh maâ phûúng phaáp tòm theo
chó muåc àûa laåi.
3. Caách tiïëp cêån dûåa vaâo phên tñch
vùn baãn
Caách tiïëp cêån cuãa chuáng töi trong tòm
kiïëm hònh aãnh ngûúâi seä kïët húåp viïåc tòm
theo chó muåc vúái viïåc phên tñch cuá phaáp
caác thûåc thïí coá tïn ngûúâi (NE) trong nöåi
3 Google Image Search,
4 Yahoo! Search- Image Search
Nhòn ra thïë giúái
32 THÖNG TIN vaâ TÛ LIÏÅU - 2/2012
dung vùn baãn. Nïëu cho möåt cêu hoãi tòm tïn
ngûúâi, caách tòm kiïëm theo chó muåc thûúâng
cung cêëp nhûäng hònh aãnh khöng àuáng
ngoaâi nhûäng hònh aãnh àuáng cuãa caá nhên
muåc tiïu. YÁ tûúãng chñnh laâ xêy dûång böå
quy tùæc cuá phaáp tûâ thöng tin vùn baãn àïí loåc
ra caác hònh aãnh khöng àuáng.
Hònh 3 minh hoåa quy trònh töíng thïí xêy
dûång böå quy tùæc cuá phaáp tûâ möåt têåp húåp
muåc tin. Nïëu muåc tin chûáa möåt hònh aãnh
ngûúâi, chuáng töi aáp duång viïåc nhêån biïët
thûåc thïí coá tïn àïí àõnh nhaän têët caã caác thûåc
thïí coá tïn cuãa con ngûúâi xaä höåi trong thöng
tin vùn baãn (nghôa laâ: àêìu àïì, phuå àïì vaâ chuá
thñch aãnh). Têët caác caác cêu coá chûáa caác
thûåc thïí coá tïn ngûúâi àûúåc têåp húåp vaâ àõnh
nhaän nhû laâ caác mêîu khùèng àõnh hoùåc phuã
àõnh. Mêîu khùèng àõnh laâ caác cêu coá chûáa
tïn ngûúâi àûúåc hiïín thõ trong hònh aãnh.
Mêîu phuã àõnh laâ caác cêu coá chûáa tïn ngûúâi
khaác maâ khöng xuêët hiïån trong hònh aãnh.
Hònh 4 laâ vñ duå vïì caác mêîu khùèng àõnh vaâ
phuã àõnh. Àöëi vúái mêîu khùèng àõnh, cêu hoãi
tòm “Tiger Woods” seä aánh xaå àuáng vúái
hònh aãnh àaä cho. Àöëi vúái mêîu phuã àõnh,
cêu hoãi tòm “Rafael Nadal” coá thïí seä aánh
xaå sai túái hònh aãnh cuãa möåt cêìu thuã quêìn
vúåt khaác “Lleyton Hewitt”. Coá thïí thêëy
rùçng, àöëi vúái mêîu khùèng àõnh, tïn ngûúâi
muåc tiïu xuêët hiïån nhû laâ chuã ngûä cuãa cêu.
Mùåt khaác, àöëi vúái mêîu phuã àõnh, tïn ngûúâi
muåc tiïu xuêët hiïån nhû laâ tên ngûä cuãa cêu.
Hònh 3. Caách tiïëp cêån àïí xêy dûång böå quy tùæc saâng loåc
Nhòn ra thïë giúái
THÖNG TIN vaâ TÛ LIÏÅU - 2/2012 33
Möåt khi thu thêåp àûúåc caác mêîu khùèng
àõnh vaâ phuã àõnh tûâ têåp húåp tin tûác, thò kyä
thuêåt phên tñch cuá phaáp sú böå àûúåc aáp duång
àïí phên àoaån vaâ àõnh nhaän caác thûåc thïí coá tïn
ngûúâi vaâ têët caã caác thuêåt ngûä khaác trong cêu.
Chùèng haån, cêu “Obama cêìn 1,5 tyã àöla
cho caác chïë phêím chöëng dõch” seä àûúåc
phên tñch cuá phaáp vaâ àõnh nhaän nhû sau
[NP Obama] {VP cêìn] [NP1,5 tyã àöla],
[PP daânh cho] [NP caác chïë phêím chöëng
dõch]; trong àoá NP chó cuåm danh tûâ, VP chó
cuåm àöång tûâ vaâ PP chó cuåm giúái tûâ. Vò cêu
trïn coá chûáa hònh aãnh cuãa “Barack
Obama”, chuáng ta coá thïí coá quy tùæc nhêån
daång khùèng àõnh nhû [#] [NP*] [VP] [NP]:
khùèng àõnh, trong àoá # chó giúái haån cêu, *
chó võ trñ xuêët hiïån tïn ngûúâi vaâ: khùèng
àõnh laâ nhaän loaåi. Trong baâi naây, chuáng töi
duâng NLP múã, 5 , möåt cöng cuå phên tñch
vùn baãn, àïí thûåc hiïån têët caã caác nhiïåm vuå
xûã lyá vùn baãn liïn quan.
Hònh 4. Vñ duå vïì caác mêîu khùèng àõnh vaâ phuã àõnh
Mêîu khùèng àõnh cho cêu hoãi tòm
“Tiger Woods”
Mêîu khùèng àõnh cho cêu hoãi tòm
“Rafael Nadal”
Àêìu àïì: Tiger Woods cêìn
bùæt àêìu ra quên súám hún Tiïíu àïì: Nhaâ 4 lêìn vö àõch Lieyton
Hewitt seä cuâng Andy Muray vaâ Rafael
Nadal tham gia giaãi vö àõch AEGON
thaáng sau úã Cêu laåc böå Queen
5 The OpenNLP Homepape,
Hònh 5. Quy trònh saâng loåc kïët quaã tòm kiïëm hònh aãnh
Nhòn ra thïë giúái
34 THÖNG TIN vaâ TÛ LIÏÅU - 2/2012
Sau khi coá böå quy tùæc nhêån daång khùèng
àõnh vaâ phuã àõnh, chuáng töi xêy dûång böå
quy tùæc saâng loåc àïí loåc ra caác kïët quaã hònh
aãnh sai àûúåc höìi àaáp tûâ pheáp tòm theo chó
muåc. Cuâng möåt söë quy tùæc cuá phaáp coá thïí
coá nhûäng nhaän loaåi khùèng àõnh vaâ phuã
àõnh. Do àoá, chuáng töi tñnh tyã söë àiïím cuãa
tûâng quy tùæc saâng loåc bùçng tyã söë giûäa söë
nhaän phuã àõnh vaâ söë nhaän khùèng àõnh.
Trûúâng húåp söë nhaän khùèng àõnh bùçng 0,
nghôa laâ quy tùæc chó xuêët hiïån úã loaåi phuã
àõnh. Nhûäng quy tùæc naây thûúâng àûúåc coi
laâ àûáng àêìu trong söë caác quy tùæc khaác. Tyã
söë àiïím bùçng 1, nghôa laâ quy tùæc xuêët hiïån
ngang nhau trong caã loaåi khùèng àõnh vaâ
phuã àõnh. Chuáng töi xem xeát caác quy tùæc coá
giaá trõ tyã söë àiïím lúán hún 1 (nghôa laâ, söë
lûúång (quy tùæc phuã àõnh) > söë lûúång (quy
tùæc khùèng àõnh). Hònh 5 minh hoåa quaá trònh
saâng loåc caác kïët quaã tòm kiïëm hònh aãnh tûâ
caách tiïëp cêån tòm theo chó muåc. Nïëu àùåt
cêu hoãi tòm theo tïn ngûúâi, hïå thöëng seä tòm
thêëy têët caã caác hònh aãnh coá chûáa tïn cuãa caá
nhên muåc tiïu tûâ baãng chó muåc. Kïë tiïëp,
caác baãn mö taã thaânh vùn caác hònh aãnh àûúåc
xûã lyá vúái pheáp phên tñch cuá phaáp sú böå, sau
àoá, caác quy tùæc saâng loåc àûúåc aáp duång àïí
loaåi ra caác hònh aãnh chùæc chùæn khöng chûáa
caá nhên muåc tiïu.
Caác thûã nghiïåm vaâ trao àöíi
Àïí àaánh giaá hiïåu quaã cuãa phûúng phaáp
maâ chuáng töi àûa ra, chuáng töi thûåc hiïån
möåt söë thñ nghiïåm coá sûã duång böå sûu têåp
hònh aãnh tin tûác nhêån àûúåc tûâ caách tòm hònh
aãnh tin tûác trïn Google. Khi coá danh saách
caác caá nhên thuöåc caác loaåi khaác nhau (nhû
trònh baây trong Baãng 1), chuáng töi taãi
xuöëng caác nöåi dung vùn baãn cuâng vúái hònh
aãnh vaâ chuá thñch keâm theo. Söë lûúång hònh
aãnh hiïån taåi trong têåp húåp xêëp xó 500.
Sûã duång têåp húåp naây, chuáng töi àaä xêy
dûång böå quy tùæc saâng loåc dûåa vaâo quy trònh
àaä noái úã trïn. Chuáng töi àùåt söë lûúång töëi àa
gram cho pheáp (nghôa laâ söë lûúång maä
söë àiïím (quy tùæc saâng loåc) =
söë lûúång (quy tùæc phuã àõnh)
söë lûúång (quy tùæc khùèng àõnh)
Baãng 1. Danh saách tïn ngûúâi trong têåp
húåp thûã nghiïåm
Tïn ngûúâi Loaåi
Barack Obama Chñnh trõ
Hillary Clinton Chñnh trõ
Tiger Woods Thïí thao
David Beckham Thïí thao
Rafael Nadal Thïí thao
Britney Spears Giaãi trñ
Angelina Jolie Giaãi trñ
Caác quy tùæc saâng loåc Tyã söëàiïím
[NP] [VP] [NP*][PP][NP] 7,0
[#] [NP*] [O] [#] 5,0
[NP] [VP] [NP*] [#] 2,67
[#] [NP*] [VP] [ADVP] 2,0
[#] [NP*] [NP] [O] 2,0
[O] [VP] [NP*] [O] [#] 2,0
[O] [VP] [NP*][NP] [O] 2,0
[NP] [VP] [NP*] [VP] [NP] 2,0
[NP] [O] [NP*] [VP] [ADJP] 2,0
[NP] [PP] [NP*][O] [NP] 1,67
Baãng 2. Caác quy tùæc saâng loåc haâng àêìu
Nhòn ra thïë giúái
THÖNG TIN vaâ TÛ LIÏÅU - 2/2012 35
thöng baáo trong möåt quy tùæc) bùçng 5 xuyïn
suöët caác thûã nghiïåm . Baãng 2 cho thêëy möåt
söë quy tùæc haâng àêìu dûåa vaâo tñnh àiïím
àûúåc cho trong phûúng trònh (1), trong àoá,
[#] chó giúái haån cêu, * chó võ trñ xuêët hiïån
tïn ngûúâi, NP chó cuåm danh tûâ, VP chó cuåm
àöång tûâ, PP chó cuåm giúái tûâ , ADVP chó
cuåm traång tûâ, ADJP chó cuåm tñnh tûâ, vaâ O
chó möåt kyá tûå àùåc biïåt. Coá thïí tòm thêëy
danh saách àêìy àuã kyá hiïåu àõnh nhaän tûâ Dûå
aán Penn Treebank6.
Chuáng töi àaánh giaá hiïåu suêët cuãa caách
tiïëp cêån phên tñch cuá phaáp àaä àûa ra bùçng
caách so saánh vúái caách tòm theo chó muåc.
Àöëi vúái caách tòm theo chó muåc, chuáng töi
xêy dûång möåt baãng chó muåc caác thuêåt ngûä
àûúåc taách ra vaâ maä hoáa thöng baáo tûâ thöng
tin vùn baãn cuãa möîi muåc tin. Àöëi vúái caách
tiïëp cêån phên tñch cuá phaáp, chuáng töi aáp
duång böå quy tùæc cuá phaáp àïí loåc ra caác kïët
quaã hònh aãnh maâ caách tòm theo chó muåc
àem laåi. Möåt hònh aãnh maâ trong àoá vùn baãn
kïët húåp ûáng vúái caác quy tùæc saâng loåc seä
àûúåc loaåi khoãi caác kïët quaã. Chuáng töi sûã
duång pheáp trùæc lûúång tòm chuêín vïì àöå
chñnh xaác, mûác àöå höìi àaáp (mûác àöå tòm laåi
àûúåc) vaâ söë ào F1 àïí àaánh giaá. Caác kïët quaã
thûã nghiïåm àûúåc töíng kïët trong Baãng 3.
Tûâ caác kïët quaã àoá, caách tiïëp cêån tòm
theo chó muåc àaä cho mûác àöå höìi àaáp bùçng
100%. Àiïìu naây coá àûúåc laâ do cêu hoãi tòm
ngûúâi ûáng vúái têët caã caác hònh aãnh coá chûáa
tïn ngûúâi àoá trong thöng tin vùn baãn. Tuy
nhiïn, hún möåt nûãa kïët quaã àûa laåi àaä
khöng chûáa hònh aãnh àuáng cuãa caá nhên
muåc tiïu. Kïët quaã laâ giaá trõ vïì àöå chñnh xaác
chó xêëp xó 47%. Viïåc aáp duång quy trònh
saâng loåc giuáp nêng cao àöå chñnh xaác lïn
xêëp xó 59%, trong khi mûác àöå höìi àaáp hêìu
nhû vêîn giûä nguyïn. Do àoá, caách phên tñch
cuá phaáp giuáp loaåi boã möåt söë trûúâng húåp
khùèng àõnh sai cuãa caách tòm theo chó muåc.
Toám laåi, caách tiïëp cêån tòm theo chó muåc àaä
cho hiïåu suêët theo söë ào F1 bùçng 64,10%.
Khi duâng caách phên tñch cuá phaáp, F1 àaä
tùng lïn 74,17%. Do àoá, caác quy tùæc cuá
phaáp coá ñch cho viïåc saâng loåc kïët quaã sai tûâ
caác hònh aãnh maâ caách tòm theo chó muåc
àem laåi.
Kïët luêån vaâ dûå àõnh tûúng lai
Chuáng töi àaä àûa ra phûúng phaáp phên
tñch cuá phaáp àïí tòm ngûúâi trong caác hònh
aãnh cuãa muåc tin. Muåc àñch chñnh cuãa
chuáng töi laâ nêng cao chêët lûúång kïët quaã
tòm kiïëm hònh aãnh thu àûúåc khi duâng caách
tòm theo chó muåc dûåa vaâo vùn baãn. Quaá
trònh àõnh nhaän thûåc thïí coá tïn vaâ phên tñch
cuá phaáp sú böå àûúåc aáp duång vaâo nöåi dung
vùn baãn, vñ duå, àêìu àïì tin vaâ chuá thñch hònh
aãnh àïí gaán nhaän loaåi tûâ (POS) thñch húåp
cho caác thûåc thïí tïn ngûúâi vaâ moåi thuêåt
ngûä khaác. Möåt böå quy tùæc cuá phaáp àïí nhêån
daång ngûúâi xuêët hiïån trong caác hònh aãnh
àûúåc xêy dûång tûâ têåp húåp coá àõnh nhaän.
Baãng 3. Kïët quaã àaánh giaá caách tòm hònh aãnh ngûúâi tûâ caác muåc tin tûác
Caách tiïëp cêån Àöå chñnh xaác Mûác àöå höìi àaáp Söë ào F1
Tòm theo chó muåc 47,17 100,00 64,10
Phên tñch cuá phaáp 59,08 99,61 74,17
6 Penn Treebank Project, treebank
Nhòn ra thïë giúái
36 THÖNG TIN vaâ TÛ LIÏÅU - 2/2012
Chuáng töi sûã duång caác quy tùæc cuá phaáp naây
àïí saâng loåc caác kïët quaã hònh aãnh maâ caách
tòm theo chó muåc àem laåi. Dûåa vaâo caác kïët
quaã àaánh giaá, phûúng phaáp cuãa chuáng töi
àaä nêng hiïåu suêët lïn 10% theo söë ào F1 so
vúái pheáp tòm theo chó muåc àún giaãn.
Chuáng töi dûå àõnh aáp duång möåt söë kyä
thuêåt nhêån biïët bùçng maáy nhû caác trûúâng
ngêîu nhiïn coá àiïìu kiïån (CRFs) àïí xêy
dûång möåt caách hûäu hiïåu caác quy tùæc cuá phaáp
tûâ caác têåp húåp coá àõnh nhaän. Möåt têåp húåp
hònh aãnh tin tûác lúán hún cuäng seä àûúåc thu
thêåp vaâ sûã duång àïí àaánh giaá toaân diïån hún.
Vuä Vùn Sún (Dõch)
Nguöìn: the Role of Digital Libraries in a
Time of Global Change”: ICADL 2010,
LNCS 6102, pp. 216-225
Faces and Names in Japanese Photo News Articles
on the Web. In: Proc. of the 22nd Int. conf. on
Advanced Information Networking and Applications –
Workshops, pp. 1156-1161 (2008)
10. Liu, C., Jiang, S., Huang, Q.: Naming faces in
broadcast news video by image google. In: Proc. of
the 16th ACM int. conf. on multimedia, pp. 717-720
(2008)
11. Ozkan, D., Duygulu, P.: A Graph Based
Approach for Naming Faces on News Photos. In
Proc. of the 2006 IEEE Conf. on Computer Vision and
Pattern Recognition, pp. 1477-1482 (2006)
12. Smeulders, A.W.M., Worring, M/. Santini, S.,
Gupta, A., Jain, R.: Content-Based Image Retrieval at
the End of the Early Years. IEEE Transactions on
Patterns Analysis and Machine Intelligence 22(12),
1349-1380 (2000)
13. Shrihari, R.K.: Automatic Indexing and Con-
tent-Based Retrieval of Captioned Images. Computer
28(9), 49-56 (1995)
14. Yagnik, J., Islam, A.: Learning people annota-
tion from the web via consistency learning. In: Proc. of
the int. workshop on multimedia information retrieval,
pp. 285-290 (2007)
15. Yang, J., Hauptmann, A.G.: Naming every
individual in news video monologues. In : Proc. of the
12th ACM int. conf. on multimedia, pp. 580-587
(2004)
16. Zhao, W., Chellappa, R., Phillips P.J., Rosen-
feld, A.: Face recognition: A literature survey: ACM
Computing Surveys (CSUR) 35(4), 399-458 (2003)
1. Abney, S.: Parsing by chunks. In: Berwick, R.,
Abney, S., Tenny, C. (eds.) Principle-Based Parsing.
Kluwer Academic Publishers, Dordrecht (1991)
2. Berg, T.L., Berg, A.C., Edwards, J., Maire, M.,
White, R., Yee-Whye, T., Learned-Miller, E., Forsyth,
D.A.: Names and faces in the News. In: Proc. of the
2004 IEEE Conf. on Computer Vision and Pattern
Recognition, pp.848-854 (2004)
3. Chinchor, N.: MUC-7 Named Entity Task Defin-
ition (Version 3.5) MUC-7, Fairfax, Virginia (1998)
4. Datta, R., Joshi, D., Li, J., Wang, J.Z.: Image
Retrieval: Ideas, influences, and trends of the new
age. ACM Computing Surveys (CSUR) 40(2), 1-60
(2008)
5. Edwards, J., White, R., Forsyth, D.: Words and
Pictures in the News. In: Proc. of the HLT-NAACL
2003 workshop on learning word meaning from non-
linguistic data, pp. 6-13 (2003)
6. He, X., Cai, D., Wen, J.-R., Ma, W.-Y., Zhang,
H.-J.: Clustering and searching WWW images using
link and page layout analysis. ACM Trans. on Multi-
media Computing, Communications, and Applications
3(2) (2007)
7. Horster, E., Lienhart, R., Slaney, M.: Image
Retrieval on large-scale image databases. In : Proc.
of the 6th ACM int. conf. on image and video retrieval,
pp. 17-24 (2007)
8. Kherfi, M.L. Ziou, D., Bernardi, A.: Image
Retrieval from the World Wide Web Issues, Tech-
niques, and Systems . ACM Computing Surveys
(CSUR) 36(1), 35-67 (2004)
9. Kitahara, A, Joutou, T., Yanai, K.: Associating
Tham chiïëu thû muåc
Các file đính kèm theo tài liệu này:
- 9355_33288_1_pb_9509.pdf