Nhận dạng cá nhân trong hình ảnh của mục tin dựa vào phân tích văn bản

Tài liệu Nhận dạng cá nhân trong hình ảnh của mục tin dựa vào phân tích văn bản

pdf9 trang | Chia sẻ: honghanh66 | Lượt xem: 681 | Lượt tải: 0download
Bạn đang xem nội dung tài liệu Nhận dạng cá nhân trong hình ảnh của mục tin dựa vào phân tích văn bản, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Nhòn ra thïë giúái 28 THÖNG TIN vaâ TÛ LIÏÅU - 2/2012 1. Múã àêìu Àïí tùng thïm hònh aãnh vaâ cung cêëp cho ngûúâi àoåc taâi liïåu minh hoåa, phêìn lúán website tin tûác thûúâng àûa vaâo baâi muåc caác nöåi dung àa phûúng tiïån gùæn vúái hònh aãnh vaâ video clip. Möåt trong nhûäng muåc tiïu vaâ thaách thûác trong viïåc tòm hònh aãnh laâ phaãi nhêån daång àuáng vaâ tòm àûúåc hònh aãnh cuãa caá nhên cuå thïí tûâ böå sûu têåp hònh aãnh lúán. Nhûäng cöng trònh nghiïn cûáu trûúác àêy vïì nhêån daång con ngûúâi trong caác hònh aãnh thûúâng dûåa vaâo hai caách tiïëp cêån khaác nhau: nhêån mùåt vaâ tòm chó muåc. Nhêån mùåt dûåa vaâo möåt söë kyä thuêåt xûã lyá hònh aãnh àïí xêy dûång vaâ nhêån biïët caác àùåc àiïím tûâ hònh aãnh böå mùåt [16]. Vúái möåt loaåt caãi tiïën àûúåc thûåc hiïån trong nhiïìu nùm qua, nhêån mùåt àaä àûúåc aáp duång thaânh cöng trong nhiïìu ûáng duång nhû trùæc lûúång sinh hoåc vaâ àiïån tûã hoåc tiïu duâng (vñ duå, maáy aãnh söë). Tuy nhiïn, aáp duång nhêån daång mùåt trong lônh vûåc tòm hònh aãnh ngûúâi coá möåt söë haån chïë vò nhûäng lyá do sau àêy: (1) taách ra vaâ biïët àûúåc caác àùåc àiïím vïì hònh tûâ caác hònh aãnh àoâi hoãi rêët nhiïìu thúâi gian xûã lyá; (2) àïí nhêån ra tûâng caá nhên cuå thïí àoâi hoãi phaãi coá möåt kñch cúä mêîu hònh mùåt thñch húåp, do àoá, caách tiïëp cêån naây khöng àûúåc múã röång nhiïìu khi xûã lyá möåt söë lûúång lúán caá nhên vaâ (3) kyä thuêåt nhêån mùåt àún giaãn khöng àuã maånh àïí nhêån daång con ngûúâi tûâ nhûäng goác nhòn khaác nhau vaâ trong nhûäng hònh aãnh àöå phên giaãi thêëp. Àïí giaãi quyïët quy mö lúán cuãa Web, nhiïìu maáy tòm hònh aãnh àaä chêëp nhêån caách tiïëp cêån tòm theo chó muåc àang àûúåc aáp duång thaânh cöng cho viïåc tòm trang web [8]. Pheáp tòm theo chó muåc àiïín hònh laåi dûåa vaâo mö thûác tuái tûâ àïí xaác àõnh cêëu truác chó muåc àaão, nghôa laâ, möîi thuêåt ngûä seä chó túái möåt danh saách tû liïåu coá chûáa thuêåt ngûä àoá. Theo mö thûác tuái tûâ, möåt tû liïåu coá chûáa cêu hoãi àêìu vaâo úã bêët kyâ chöî naâo trong nöåi dung àïìu àûúåc coi laâ truáng àñch vaâ seä àûúåc phaãn höìi cho ngûúâi sûã duång. Àöëi vúái pheáp tòm hònh aãnh, möåt chó muåc coá thïí àûúåc xêy dûång tûâ nhiïìu mêíu thöng tin vùn baãn nhû tïn file aãnh, caác lúâi thuyïët minh gùæn liïìn vúái hònh aãnh vaâ caác àoaån vùn baãn liïìn kïì vúái hònh aãnh [6]. Noái chung, sûã duång pheáp tòm theo chó muåc cho caác hònh aãnh trïn Web laâ hûäu hiïåu. Tuy nhiïn, tòm hònh aãnh cuãa caác caá nhên cuå thïí trong lônh vûåc tin tûác àöi khi coá thïí àûa ra kïët quaã khöng mong muöën. Vúái mö thûác tuái tûâ àún giaãn, möåt cêu hoãi tòm möåt ngûúâi coá thïí tûúng ûáng vúái möåt vaâi muåc tin (nghôa laâ ngûúâi àoá àûúåc noái túái trong nhiïìu tin) maâ hònh aãnh cuãa caác muåc àoá coá caã aãnh cuãa nhûäng ngûúâi khaác. Do àoá, nhûäng hònh aãnh khöng tûúng thñch àöi khi cuäng àûúåc àûa ra cho ngûúâi sûã duång cuâng vúái hònh aãnh àuáng cuãa caá nhên muåc tiïu. Chuáng töi xin minh hoåa vêën àïì naây bùçng caách sûã duång möåt vñ duå tûâ Pheáp tòm hònh aãnh tin tûác theo Google11 dûåa trïn phûúng phaáp tiïëp cêån tòm theo chó muåc. Hònh 1 cho NHÊÅN DAÅNG CAÁ NHÊN TRONG HÒNH AÃNH CUÃA MUÅC TIN DÛÅA VAÂO PHÊN TÑCH VÙN BAÃN Choochart Haruechaliyasak vaâ Chaianun Damrongrat Trung têm Quöëc gia Cöng nghïå Àiïån tûã vaâ Maáy tñnh Thaái Lan 1 Google News, Nhòn ra thïë giúái THÖNG TIN vaâ TÛ LIÏÅU - 2/2012 29 thêëy kïët quaã tòm bùçng caách sûã duång “Barack Obama” laâm cêu hoãi. Tûâ caác kïët quaã naây, hún möåt nûãa söë hònh aãnh phaãn höìi khöng coá hònh aãnh cuãa“Barack Obama”. Theo quan saát ban àêìu cuãa chuáng töi, möåt muåc tin thûúâng chûáa hònh aãnh cuãa caá nhên muåc tiïu nïëu tïn cuãa ngûúâi àoá xuêët hiïån nhû chuã ngûä chñnh trong caác cêu khaác nhau cuãa muåc tin, vñ duå trong àêìu àïì vaâ chuá thñch hònh aãnh. Hònh 2 laâ vñ duå vïì möåt muåc tin lêëy tûâ website tin tûác cuãa CNN2 coá chûáa hònh aãnh cuãa möåt caá nhên vúái àêìu àïì vaâ chuá thñch hònh aãnh. Tûâ hònh naây, hai thûåc thïí tïn ngûúâi “Hillary Clinton” vaâ “Barack Obama” xuêët hiïån trong caã àêìu àïì lêîn chuá thñch hònh aãnh. Khi sûã duång pheáp tòm theo chó muåc àún giaãn, möåt cêu hoãi tòm “Barack Obama” coá thïí seä àûa nhêìm hònh aãnh naây cuãa “Hillary Clinton”. Muåc àñch chñnh cuãa baâi naây laâ caãi tiïën hiïåu suêët cuãa pheáp tòm theo chó muåc cú baãn àïí tòm àûúåc caác caá nhên trong caác hònh aãnh tin tûác. Caách tiïëp cêån cuãa chuáng töi laâ aáp duång phên tñch cuá phaáp vïì nöåi dung vùn baãn (vñ duå, caác àêìu àïì vaâ chuá thñch hònh aãnh) àïí nhêån daång khùèng àõnh vaâ phuã àõnh caá nhên trong caác hònh aãnh tin tûác. Pheáp phên tñch cuá phaáp trong phûúng phaáp cuãa chuáng töi bao göìm viïåc àõnh nhaän thûåc thïí coá tïn vaâ phên tñch cuá phaáp sú böå [1, 3]. Tûâ Hònh 2, bùçng caách thûåc hiïån phên tñch àêìu àïì tin, “Clinton” seä àûúåc phên tñch vaâ àõnh nhaän nhû laâ möåt cuåm danh tûâ (NP), sau àoá “chêëp nhêån” nhû möåt cuåm àöång tûâ (VP) vaâ “Obama” nhû laâ möåt cuåm danh tûâ (NP) Hònh 1. Kïët quaã tòm “Barack Obama” theo pheáp tòm hònh aãnh tin tûác trïn Google 2 CNN.com International , Nhòn ra thïë giúái 30 THÖNG TIN vaâ TÛ LIÏÅU - 2/2012 Tûâ cêu naây, coá thïí ruát ra hai quy tùæc: (1) [NP*] [VP] [NP] àïí nhêån daång khùèng àõnh ngûúâi trong caác hònh aãnh : vaâ (2) [NP] [VP] [NP*] àïí nhêån daång phuã àõnh, trong àoá dêëu * chó võ trñ xuêët hiïån tïn ngûúâi. Quy tùæc nhêån daång khùèng àõnh coá nghôa laâ: nïëu tïn ngûúâi àoá xuêët hiïån nhû möåt cuåm danh tûâ vaâ laâ chuã ngûä cuãa möåt cêu thò hònh aãnh naây chùæc chùæn coá chûáa ngûúâi muöën tòm. Ngûúåc laåi, quy tùæc nhêån daång phuã àõnh coá nghôa laâ: nïëu tïn ngûúâi naây xuêët hiïån nhû möåt cuåm danh tûâ vaâ laâ tên ngûä cuãa möåt cêu thò hònh aãnh naây khöng chùæc chùæn chûáa ngûúâi muöën tòm. Sûã duång têåp húåp muåc tin coá àõnh nhaän, chuáng ta xêy dûång àûúåc möåt böå quy tùæc cuá phaáp dûåa vaâo nhûäng yá tûúãng noái trïn. Sau àoá, böå quy tùæc cuá phaáp àûúåc sûã duång àïí lûåa choån vaâ saâng loåc caác kïët quaã hònh aãnh do pheáp tòm theo chó muåc àem laåi. Tûâ vñ duå trïn, cêu hoãi “Obama” seä tòm ra hònh aãnh tûâ Hònh 2, tuy nhiïn, hònh aãnh naây seä àûúåc loåc ra bùçng caách sûã duång quy tùæc nhêån daång phuã àõnh [NP] [VP] [NP*] vò “Obama” xuêët hiïån nhû laâ NP* trong cêu. Kïët quaã thñ nghiïåm vïì têåp húåp hònh aãnh tin tûác cho thêëy, caách tiïëp cêån phên tñch cuá phaáp coá thïí caãi thiïån möåt caách àaáng kïí hiïåu suêët tòm kiïëm àöëi vúái pheáp tòm theo chó muåc cú baãn. 2. Caác cöng trònh nghiïn cûáu liïn quan Caác cöng trònh nghiïn cûáu trûúác àêy vïì tòm kiïëm hònh aãnh chuã yïëu dûåa vaâo hai kyä thuêåt khaác nhau : tòm hònh aãnh dûåa vaâo vùn baãn vaâ dûåa vaâo nöåi dung (CBIR) [4]. Caách tiïëp cêån dûåa vaâo vùn baãn cùn cûá vaâo thöng tin vùn baãn kïët húåp vúái hònh aãnh àïí khúáp möåt cêu hoãi àêìu vaâo, göìm möåt hay nhiïìu tûâ, vaâo caác hònh aãnh. Do khaã nùng tuây biïën kñch cúä, caách tòm hònh aãnh dûåa vaâo vùn baãn àaä àûúåc aáp duång phöí biïën úã nhiïìu maáy tòm Àêìu àïì: Clinton hêåu thuêîn cho Obama, kïu goåi sûå thöëng nhêët trong Àaãng Hònh 2. Vñ duå vïì hònh aãnh möåt caá nhên vúái àêìu àïì vaâ chuá thñch hònh aãnh Chuá thñch : Thûúång nghõ syä Hillary Clinton caãm ún nhûäng ngûúâi uãng höå baâ vïì baâi diïîn vùn hêåu thuêîn cho Thûúång nghõ syä Barack Obama Nhòn ra thïë giúái THÖNG TIN vaâ TÛ LIÏÅU - 2/2012 31 nhû Google 3 vaâ Yahoo 4 . Mùåt khaác, CBIR aáp duång kyä thuêåt xûã lyá hònh aãnh àïí taách ra vaâ biïët àûúåc caác àùåc àiïím hònh tûâ caác hònh aãnh . Trong caác hïå thöëng CBIR, möåt cêu hoãi vïì hònh, mö taã caác àùåc àiïím hònh nhû maâu sùæc vaâ kïët cêëu, àûúåc duâng àïí tòm ra hònh aãnh tûúng ûáng töët nhêët vúái caác àùåc àiïím àêìu vaâo [7, 12]. Vúái söë lûúång lúán hònh aãnh trïn Web coá chûáa aãnh cuãa caác caá nhên, àïì taâi nghiïn cûáu vïì tòm kiïëm hònh aãnh phuåc vuå cho viïåc tòm hònh aãnh ngûúâi àaä ngaây caâng àûúåc chuá yá. Trong caách tòm hònh aãnh ngûúâi, nïëu àùåt cêu hoãi tòm möåt tïn ngûúâi cuå thïí, muåc àñch laâ phaãi tòm àûúåc chñnh xaác caác hònh aãnh cuãa ngûúâi àoá (ûu tiïn laâ aãnh caá nhên) tûâ böå sûu têåp hònh aãnh lúán (vñ duå, tûâ caác website tin tûác). Kyä thuêåt tòm hònh aãnh ngûúâi tûúng tûå nhû caác kyä thuêåt àûúåc sûã duång àïí tòm kiïëm hònh aãnh noái chung. Caách tiïëp cêån dûåa vaâo nöåi dung, vaâo kyä thuêåt nhêån mùåt àïí xêy dûång vaâ biïët caác àùåc àiïím hònh tûâ hònh aãnh böå mùåt. Rêët nhiïìu cöng trònh nghiïn cûáu trûúác àêy vïì tòm kiïëm hònh aãnh ngûúâi àïìu dûåa vaâo kyä thuêåt nhêån mùåt [2,9,10,11]. Chuáng àaä aáp duång caác biïën thïí cuãa kyä thuêåt nhêån mùåt àïí liïn kïët caác hònh aãnh mùåt vúái tïn ngûúâi àûúåc tòm thêëy trong caác muåc tin. Nhû àaä noái úã trïn, aáp duång kyä thuêåt nhêån mùåt khöng coá nhiïìu khaã nùng nêng cúä tuây biïën vò coá nhiïìu ngûúâi trong caác tin tûác. Do àoá, cêìn coá möåt kñch cúä mêîu lúán cuãa hònh aãnh mùåt cho möîi caá nhên. Ngoaâi ra, viïåc taách ra vaâ nhêån biïët caác àùåc àiïím hònh tûâ hònh aãnh mùåt àoâi hoãi nhiïìu thúâi gian xûã lyá. Àïí tùng khaã nùng nêng cúä tuây biïën, nhiïìu cöng trònh nghiïn cûáu àaä aáp duång caách tiïëp cêån dûåa vaâo vùn baãn àïí tòm ngûúâi trong caác muåc tin tûác. Sihari [13] àaä àûa ra hïå thöëng goåi laâ Piction, duâng caác chuá thñch aãnh àïí nhêån daång tûâng caá nhên tûâ möåt hònh aãnh coá chûáa nhiïìu ngûúâi. Hïå thöëng naây kïët húåp thuêåt toaán àõnh võ mùåt trong hònh aãnh vúái möàun NLP àïí phên tñch võ trñ khöng gian cuãa caá nhên tûâ chuá thñch hònh aãnh. Yagnik vaâ Islam [14] àaä àûa ra phûúng phaáp dûåa vaâo nhêån biïët sûå àöìng xuêët hiïån cuãa vùn baãn vaâ hònh aãnh trïn Web. Caách tiïëp cêån naây goåi laâ nhêån biïët nhêët quaán, thûúâng duâng àïí chuá giaãi hònh aãnh ngûúâi. Yang vaâ Hauptmann [15] àûa ra phûúng phaáp nhêån biïët thöëng kï àïí nhêån daång möîi caá nhên xuêët hiïån trong bùng video truyïìn hònh dûåa vaâo vùn caãnh tòm thêëy trong caác baãn sao cheáp video. Edwards vaâ nhûäng ngûúâi khaác [5] aáp duång phûúng phaáp phên nhoám vùn baãn àïí têåp húåp hònh aãnh ngûúâi vaâo möåt söë nhoám chuã àïì. Möåt söë quan saát vïì cêëu truác cuá phaáp tïn ngûúâi trong caác chuá thñch hònh aãnh àaä àûúåc baân àïën vaâ sûã duång trong caác thñ nghiïåm. Phêìn àoáng goáp chñnh cuãa chuáng töi laâ àûa ra caách tiïëp cêån coá hiïåu lûåc vaâ coá khaã nùng nêng cúä tuây biïën tûå àöång xêy dûång böå quy tùæc cuá phaáp àïí nhêån daång caá nhên trong caác hònh aãnh tin tûác. Caác quy tùæc naây àûúåc sûã duång àïí choån lûåa vaâ saâng loåc caác kïët quaã hònh aãnh maâ phûúng phaáp tòm theo chó muåc àûa laåi. 3. Caách tiïëp cêån dûåa vaâo phên tñch vùn baãn Caách tiïëp cêån cuãa chuáng töi trong tòm kiïëm hònh aãnh ngûúâi seä kïët húåp viïåc tòm theo chó muåc vúái viïåc phên tñch cuá phaáp caác thûåc thïí coá tïn ngûúâi (NE) trong nöåi 3 Google Image Search, 4 Yahoo! Search- Image Search Nhòn ra thïë giúái 32 THÖNG TIN vaâ TÛ LIÏÅU - 2/2012 dung vùn baãn. Nïëu cho möåt cêu hoãi tòm tïn ngûúâi, caách tòm kiïëm theo chó muåc thûúâng cung cêëp nhûäng hònh aãnh khöng àuáng ngoaâi nhûäng hònh aãnh àuáng cuãa caá nhên muåc tiïu. YÁ tûúãng chñnh laâ xêy dûång böå quy tùæc cuá phaáp tûâ thöng tin vùn baãn àïí loåc ra caác hònh aãnh khöng àuáng. Hònh 3 minh hoåa quy trònh töíng thïí xêy dûång böå quy tùæc cuá phaáp tûâ möåt têåp húåp muåc tin. Nïëu muåc tin chûáa möåt hònh aãnh ngûúâi, chuáng töi aáp duång viïåc nhêån biïët thûåc thïí coá tïn àïí àõnh nhaän têët caã caác thûåc thïí coá tïn cuãa con ngûúâi xaä höåi trong thöng tin vùn baãn (nghôa laâ: àêìu àïì, phuå àïì vaâ chuá thñch aãnh). Têët caác caác cêu coá chûáa caác thûåc thïí coá tïn ngûúâi àûúåc têåp húåp vaâ àõnh nhaän nhû laâ caác mêîu khùèng àõnh hoùåc phuã àõnh. Mêîu khùèng àõnh laâ caác cêu coá chûáa tïn ngûúâi àûúåc hiïín thõ trong hònh aãnh. Mêîu phuã àõnh laâ caác cêu coá chûáa tïn ngûúâi khaác maâ khöng xuêët hiïån trong hònh aãnh. Hònh 4 laâ vñ duå vïì caác mêîu khùèng àõnh vaâ phuã àõnh. Àöëi vúái mêîu khùèng àõnh, cêu hoãi tòm “Tiger Woods” seä aánh xaå àuáng vúái hònh aãnh àaä cho. Àöëi vúái mêîu phuã àõnh, cêu hoãi tòm “Rafael Nadal” coá thïí seä aánh xaå sai túái hònh aãnh cuãa möåt cêìu thuã quêìn vúåt khaác “Lleyton Hewitt”. Coá thïí thêëy rùçng, àöëi vúái mêîu khùèng àõnh, tïn ngûúâi muåc tiïu xuêët hiïån nhû laâ chuã ngûä cuãa cêu. Mùåt khaác, àöëi vúái mêîu phuã àõnh, tïn ngûúâi muåc tiïu xuêët hiïån nhû laâ tên ngûä cuãa cêu. Hònh 3. Caách tiïëp cêån àïí xêy dûång böå quy tùæc saâng loåc Nhòn ra thïë giúái THÖNG TIN vaâ TÛ LIÏÅU - 2/2012 33 Möåt khi thu thêåp àûúåc caác mêîu khùèng àõnh vaâ phuã àõnh tûâ têåp húåp tin tûác, thò kyä thuêåt phên tñch cuá phaáp sú böå àûúåc aáp duång àïí phên àoaån vaâ àõnh nhaän caác thûåc thïí coá tïn ngûúâi vaâ têët caã caác thuêåt ngûä khaác trong cêu. Chùèng haån, cêu “Obama cêìn 1,5 tyã àöla cho caác chïë phêím chöëng dõch” seä àûúåc phên tñch cuá phaáp vaâ àõnh nhaän nhû sau [NP Obama] {VP cêìn] [NP1,5 tyã àöla], [PP daânh cho] [NP caác chïë phêím chöëng dõch]; trong àoá NP chó cuåm danh tûâ, VP chó cuåm àöång tûâ vaâ PP chó cuåm giúái tûâ. Vò cêu trïn coá chûáa hònh aãnh cuãa “Barack Obama”, chuáng ta coá thïí coá quy tùæc nhêån daång khùèng àõnh nhû [#] [NP*] [VP] [NP]: khùèng àõnh, trong àoá # chó giúái haån cêu, * chó võ trñ xuêët hiïån tïn ngûúâi vaâ: khùèng àõnh laâ nhaän loaåi. Trong baâi naây, chuáng töi duâng NLP múã, 5 , möåt cöng cuå phên tñch vùn baãn, àïí thûåc hiïån têët caã caác nhiïåm vuå xûã lyá vùn baãn liïn quan. Hònh 4. Vñ duå vïì caác mêîu khùèng àõnh vaâ phuã àõnh Mêîu khùèng àõnh cho cêu hoãi tòm “Tiger Woods” Mêîu khùèng àõnh cho cêu hoãi tòm “Rafael Nadal” Àêìu àïì: Tiger Woods cêìn bùæt àêìu ra quên súám hún Tiïíu àïì: Nhaâ 4 lêìn vö àõch Lieyton Hewitt seä cuâng Andy Muray vaâ Rafael Nadal tham gia giaãi vö àõch AEGON thaáng sau úã Cêu laåc böå Queen 5 The OpenNLP Homepape, Hònh 5. Quy trònh saâng loåc kïët quaã tòm kiïëm hònh aãnh Nhòn ra thïë giúái 34 THÖNG TIN vaâ TÛ LIÏÅU - 2/2012 Sau khi coá böå quy tùæc nhêån daång khùèng àõnh vaâ phuã àõnh, chuáng töi xêy dûång böå quy tùæc saâng loåc àïí loåc ra caác kïët quaã hònh aãnh sai àûúåc höìi àaáp tûâ pheáp tòm theo chó muåc. Cuâng möåt söë quy tùæc cuá phaáp coá thïí coá nhûäng nhaän loaåi khùèng àõnh vaâ phuã àõnh. Do àoá, chuáng töi tñnh tyã söë àiïím cuãa tûâng quy tùæc saâng loåc bùçng tyã söë giûäa söë nhaän phuã àõnh vaâ söë nhaän khùèng àõnh. Trûúâng húåp söë nhaän khùèng àõnh bùçng 0, nghôa laâ quy tùæc chó xuêët hiïån úã loaåi phuã àõnh. Nhûäng quy tùæc naây thûúâng àûúåc coi laâ àûáng àêìu trong söë caác quy tùæc khaác. Tyã söë àiïím bùçng 1, nghôa laâ quy tùæc xuêët hiïån ngang nhau trong caã loaåi khùèng àõnh vaâ phuã àõnh. Chuáng töi xem xeát caác quy tùæc coá giaá trõ tyã söë àiïím lúán hún 1 (nghôa laâ, söë lûúång (quy tùæc phuã àõnh) > söë lûúång (quy tùæc khùèng àõnh). Hònh 5 minh hoåa quaá trònh saâng loåc caác kïët quaã tòm kiïëm hònh aãnh tûâ caách tiïëp cêån tòm theo chó muåc. Nïëu àùåt cêu hoãi tòm theo tïn ngûúâi, hïå thöëng seä tòm thêëy têët caã caác hònh aãnh coá chûáa tïn cuãa caá nhên muåc tiïu tûâ baãng chó muåc. Kïë tiïëp, caác baãn mö taã thaânh vùn caác hònh aãnh àûúåc xûã lyá vúái pheáp phên tñch cuá phaáp sú böå, sau àoá, caác quy tùæc saâng loåc àûúåc aáp duång àïí loaåi ra caác hònh aãnh chùæc chùæn khöng chûáa caá nhên muåc tiïu. Caác thûã nghiïåm vaâ trao àöíi Àïí àaánh giaá hiïåu quaã cuãa phûúng phaáp maâ chuáng töi àûa ra, chuáng töi thûåc hiïån möåt söë thñ nghiïåm coá sûã duång böå sûu têåp hònh aãnh tin tûác nhêån àûúåc tûâ caách tòm hònh aãnh tin tûác trïn Google. Khi coá danh saách caác caá nhên thuöåc caác loaåi khaác nhau (nhû trònh baây trong Baãng 1), chuáng töi taãi xuöëng caác nöåi dung vùn baãn cuâng vúái hònh aãnh vaâ chuá thñch keâm theo. Söë lûúång hònh aãnh hiïån taåi trong têåp húåp xêëp xó 500. Sûã duång têåp húåp naây, chuáng töi àaä xêy dûång böå quy tùæc saâng loåc dûåa vaâo quy trònh àaä noái úã trïn. Chuáng töi àùåt söë lûúång töëi àa gram cho pheáp (nghôa laâ söë lûúång maä söë àiïím (quy tùæc saâng loåc) = söë lûúång (quy tùæc phuã àõnh) söë lûúång (quy tùæc khùèng àõnh) Baãng 1. Danh saách tïn ngûúâi trong têåp húåp thûã nghiïåm Tïn ngûúâi Loaåi Barack Obama Chñnh trõ Hillary Clinton Chñnh trõ Tiger Woods Thïí thao David Beckham Thïí thao Rafael Nadal Thïí thao Britney Spears Giaãi trñ Angelina Jolie Giaãi trñ Caác quy tùæc saâng loåc Tyã söëàiïím [NP] [VP] [NP*][PP][NP] 7,0 [#] [NP*] [O] [#] 5,0 [NP] [VP] [NP*] [#] 2,67 [#] [NP*] [VP] [ADVP] 2,0 [#] [NP*] [NP] [O] 2,0 [O] [VP] [NP*] [O] [#] 2,0 [O] [VP] [NP*][NP] [O] 2,0 [NP] [VP] [NP*] [VP] [NP] 2,0 [NP] [O] [NP*] [VP] [ADJP] 2,0 [NP] [PP] [NP*][O] [NP] 1,67 Baãng 2. Caác quy tùæc saâng loåc haâng àêìu Nhòn ra thïë giúái THÖNG TIN vaâ TÛ LIÏÅU - 2/2012 35 thöng baáo trong möåt quy tùæc) bùçng 5 xuyïn suöët caác thûã nghiïåm . Baãng 2 cho thêëy möåt söë quy tùæc haâng àêìu dûåa vaâo tñnh àiïím àûúåc cho trong phûúng trònh (1), trong àoá, [#] chó giúái haån cêu, * chó võ trñ xuêët hiïån tïn ngûúâi, NP chó cuåm danh tûâ, VP chó cuåm àöång tûâ, PP chó cuåm giúái tûâ , ADVP chó cuåm traång tûâ, ADJP chó cuåm tñnh tûâ, vaâ O chó möåt kyá tûå àùåc biïåt. Coá thïí tòm thêëy danh saách àêìy àuã kyá hiïåu àõnh nhaän tûâ Dûå aán Penn Treebank6. Chuáng töi àaánh giaá hiïåu suêët cuãa caách tiïëp cêån phên tñch cuá phaáp àaä àûa ra bùçng caách so saánh vúái caách tòm theo chó muåc. Àöëi vúái caách tòm theo chó muåc, chuáng töi xêy dûång möåt baãng chó muåc caác thuêåt ngûä àûúåc taách ra vaâ maä hoáa thöng baáo tûâ thöng tin vùn baãn cuãa möîi muåc tin. Àöëi vúái caách tiïëp cêån phên tñch cuá phaáp, chuáng töi aáp duång böå quy tùæc cuá phaáp àïí loåc ra caác kïët quaã hònh aãnh maâ caách tòm theo chó muåc àem laåi. Möåt hònh aãnh maâ trong àoá vùn baãn kïët húåp ûáng vúái caác quy tùæc saâng loåc seä àûúåc loaåi khoãi caác kïët quaã. Chuáng töi sûã duång pheáp trùæc lûúång tòm chuêín vïì àöå chñnh xaác, mûác àöå höìi àaáp (mûác àöå tòm laåi àûúåc) vaâ söë ào F1 àïí àaánh giaá. Caác kïët quaã thûã nghiïåm àûúåc töíng kïët trong Baãng 3. Tûâ caác kïët quaã àoá, caách tiïëp cêån tòm theo chó muåc àaä cho mûác àöå höìi àaáp bùçng 100%. Àiïìu naây coá àûúåc laâ do cêu hoãi tòm ngûúâi ûáng vúái têët caã caác hònh aãnh coá chûáa tïn ngûúâi àoá trong thöng tin vùn baãn. Tuy nhiïn, hún möåt nûãa kïët quaã àûa laåi àaä khöng chûáa hònh aãnh àuáng cuãa caá nhên muåc tiïu. Kïët quaã laâ giaá trõ vïì àöå chñnh xaác chó xêëp xó 47%. Viïåc aáp duång quy trònh saâng loåc giuáp nêng cao àöå chñnh xaác lïn xêëp xó 59%, trong khi mûác àöå höìi àaáp hêìu nhû vêîn giûä nguyïn. Do àoá, caách phên tñch cuá phaáp giuáp loaåi boã möåt söë trûúâng húåp khùèng àõnh sai cuãa caách tòm theo chó muåc. Toám laåi, caách tiïëp cêån tòm theo chó muåc àaä cho hiïåu suêët theo söë ào F1 bùçng 64,10%. Khi duâng caách phên tñch cuá phaáp, F1 àaä tùng lïn 74,17%. Do àoá, caác quy tùæc cuá phaáp coá ñch cho viïåc saâng loåc kïët quaã sai tûâ caác hònh aãnh maâ caách tòm theo chó muåc àem laåi. Kïët luêån vaâ dûå àõnh tûúng lai Chuáng töi àaä àûa ra phûúng phaáp phên tñch cuá phaáp àïí tòm ngûúâi trong caác hònh aãnh cuãa muåc tin. Muåc àñch chñnh cuãa chuáng töi laâ nêng cao chêët lûúång kïët quaã tòm kiïëm hònh aãnh thu àûúåc khi duâng caách tòm theo chó muåc dûåa vaâo vùn baãn. Quaá trònh àõnh nhaän thûåc thïí coá tïn vaâ phên tñch cuá phaáp sú böå àûúåc aáp duång vaâo nöåi dung vùn baãn, vñ duå, àêìu àïì tin vaâ chuá thñch hònh aãnh àïí gaán nhaän loaåi tûâ (POS) thñch húåp cho caác thûåc thïí tïn ngûúâi vaâ moåi thuêåt ngûä khaác. Möåt böå quy tùæc cuá phaáp àïí nhêån daång ngûúâi xuêët hiïån trong caác hònh aãnh àûúåc xêy dûång tûâ têåp húåp coá àõnh nhaän. Baãng 3. Kïët quaã àaánh giaá caách tòm hònh aãnh ngûúâi tûâ caác muåc tin tûác Caách tiïëp cêån Àöå chñnh xaác Mûác àöå höìi àaáp Söë ào F1 Tòm theo chó muåc 47,17 100,00 64,10 Phên tñch cuá phaáp 59,08 99,61 74,17 6 Penn Treebank Project, treebank Nhòn ra thïë giúái 36 THÖNG TIN vaâ TÛ LIÏÅU - 2/2012 Chuáng töi sûã duång caác quy tùæc cuá phaáp naây àïí saâng loåc caác kïët quaã hònh aãnh maâ caách tòm theo chó muåc àem laåi. Dûåa vaâo caác kïët quaã àaánh giaá, phûúng phaáp cuãa chuáng töi àaä nêng hiïåu suêët lïn 10% theo söë ào F1 so vúái pheáp tòm theo chó muåc àún giaãn. Chuáng töi dûå àõnh aáp duång möåt söë kyä thuêåt nhêån biïët bùçng maáy nhû caác trûúâng ngêîu nhiïn coá àiïìu kiïån (CRFs) àïí xêy dûång möåt caách hûäu hiïåu caác quy tùæc cuá phaáp tûâ caác têåp húåp coá àõnh nhaän. Möåt têåp húåp hònh aãnh tin tûác lúán hún cuäng seä àûúåc thu thêåp vaâ sûã duång àïí àaánh giaá toaân diïån hún. Vuä Vùn Sún (Dõch) Nguöìn: the Role of Digital Libraries in a Time of Global Change”: ICADL 2010, LNCS 6102, pp. 216-225 Faces and Names in Japanese Photo News Articles on the Web. In: Proc. of the 22nd Int. conf. on Advanced Information Networking and Applications – Workshops, pp. 1156-1161 (2008) 10. Liu, C., Jiang, S., Huang, Q.: Naming faces in broadcast news video by image google. In: Proc. of the 16th ACM int. conf. on multimedia, pp. 717-720 (2008) 11. Ozkan, D., Duygulu, P.: A Graph Based Approach for Naming Faces on News Photos. In Proc. of the 2006 IEEE Conf. on Computer Vision and Pattern Recognition, pp. 1477-1482 (2006) 12. Smeulders, A.W.M., Worring, M/. Santini, S., Gupta, A., Jain, R.: Content-Based Image Retrieval at the End of the Early Years. IEEE Transactions on Patterns Analysis and Machine Intelligence 22(12), 1349-1380 (2000) 13. Shrihari, R.K.: Automatic Indexing and Con- tent-Based Retrieval of Captioned Images. Computer 28(9), 49-56 (1995) 14. Yagnik, J., Islam, A.: Learning people annota- tion from the web via consistency learning. In: Proc. of the int. workshop on multimedia information retrieval, pp. 285-290 (2007) 15. Yang, J., Hauptmann, A.G.: Naming every individual in news video monologues. In : Proc. of the 12th ACM int. conf. on multimedia, pp. 580-587 (2004) 16. Zhao, W., Chellappa, R., Phillips P.J., Rosen- feld, A.: Face recognition: A literature survey: ACM Computing Surveys (CSUR) 35(4), 399-458 (2003) 1. Abney, S.: Parsing by chunks. In: Berwick, R., Abney, S., Tenny, C. (eds.) Principle-Based Parsing. Kluwer Academic Publishers, Dordrecht (1991) 2. Berg, T.L., Berg, A.C., Edwards, J., Maire, M., White, R., Yee-Whye, T., Learned-Miller, E., Forsyth, D.A.: Names and faces in the News. In: Proc. of the 2004 IEEE Conf. on Computer Vision and Pattern Recognition, pp.848-854 (2004) 3. Chinchor, N.: MUC-7 Named Entity Task Defin- ition (Version 3.5) MUC-7, Fairfax, Virginia (1998) 4. Datta, R., Joshi, D., Li, J., Wang, J.Z.: Image Retrieval: Ideas, influences, and trends of the new age. ACM Computing Surveys (CSUR) 40(2), 1-60 (2008) 5. Edwards, J., White, R., Forsyth, D.: Words and Pictures in the News. In: Proc. of the HLT-NAACL 2003 workshop on learning word meaning from non- linguistic data, pp. 6-13 (2003) 6. He, X., Cai, D., Wen, J.-R., Ma, W.-Y., Zhang, H.-J.: Clustering and searching WWW images using link and page layout analysis. ACM Trans. on Multi- media Computing, Communications, and Applications 3(2) (2007) 7. Horster, E., Lienhart, R., Slaney, M.: Image Retrieval on large-scale image databases. In : Proc. of the 6th ACM int. conf. on image and video retrieval, pp. 17-24 (2007) 8. Kherfi, M.L. Ziou, D., Bernardi, A.: Image Retrieval from the World Wide Web Issues, Tech- niques, and Systems . ACM Computing Surveys (CSUR) 36(1), 35-67 (2004) 9. Kitahara, A, Joutou, T., Yanai, K.: Associating Tham chiïëu thû muåc

Các file đính kèm theo tài liệu này:

  • pdf9355_33288_1_pb_9509.pdf
Tài liệu liên quan