COVID-19ari buruzko artikulu zientifikoetako informazioa automatikoki erauzteko sistema sortu dugu.
Galderak hizkuntza naturalean eginez COVID-19 eta SARS-CoV-2ari buruzko informazio-oldetik erantzunak lortzeko sistema da VIGICOVID. VIGICOVID sistema sortu dugu UPV/EHUko, UNEDeko eta Oraiko ikertzaileek lankidetzan, CRUEren Fondo Supera COVID-19 funtsa baliatuz. Pandemiaren inguruan mundu mailan egindako ikerketek sortutako informazio-oldean erantzunak bilatzeko beharrari erantzuten dio, eta adimen artifizialaren bidez, argitalpen zientifikoz osatutako bilduma batetik erantzunak bistaratzen dizkio erabiltzaileari era antolatu batean, hizkuntza naturaleko galdera-erantzunak erabiliz.
Mundu osoko ikertzaile biosanitarioak ahalegin handia ari dira egiten COVID-19aren eta SARS-CoV-2aren inguruko ezagutza sortzen. Ahalegin horren ondorioz, argitalpen zientifiko asko eta asko sortzen dira, oso azkar, eta horrek zaildu egiten du informazio hori guztia kontsultatzea eta aztertzea. Horregatik, informazio-sistemak eman behar zaizkie adituei eta erabakiak hartu behar dituzten agintariei, behar duten ezagutza eskuratzeko.
Horixe ikertu dugu VIGICOVID proiektuan UPV/EHUko HiTZ zentroko, UNEDeko NLP & IR taldeko eta Orai NLO Teknologiakeko ikertzaileek, CRUEk emandako Fondo Supera COVID-19 funtsa baliatuz. COVID-19ari eta SARS-CoV-2ari buruz mundu osoko ikertzaileek argitaratutako artikulu zientifikoen bilduma eguneratu batetik hizkuntza naturaleko galdera-erantzun bidez informazioa erauzten duen prototipo bat sortu dugu, UNEDeko ikertzaileek koordinatuta.
Bilaketak egiteko paradigma aldatzen ari da adimen artifizialari esker . Orain arte, sarean informazioa bilatzean, galdera bat sartu, eta bistaratzen diren dokumentuetan bilatu behar izaten da galdera horren erantzuna. Paradigma berriaren arabera, ordea, gero eta zabalduago daude galdera egin eta zuzenean erantzuna ematen duten sistemak, dokumentu osoa irakurri beharrik gabe.
Sistema honetan, erabiltzaileak informazioa ez du gako-hitzen bidez eskatzen, baizik eta zuzeneko galdera bat eginez. Sistemak bi pausotan bilatzen ditu galdera horren erantzuna: lehenbizi, galderaren erantzuna izan dezaketen dokumentuak berreskuratzen ditu bildumatik, gako-hitzak eta zuzeneko galderak konbinatzen dituen teknologia bat erabiliz. Horretarako, arkitektura neuronalak aztertu ditugu Adibideekin elikatutako arkitektura neuronal sakonak erabili ditugu hain zuzen ere: Horrek esan nahi du bilaketa egiteko modeloak eta galderei erantzuteko modeloak ikasketa automatiko sakonaren bitartez entrenatzen direla.
Dokumentu-sorta bat erauzi ondoren, berriro prozesatzen dira dokumentuak galdera-erantzuneko sistema baten bidez, erantzun zehatzak lortzeko. Galderak erantzuten dituen motorra egin dugu, zeina gai baita galdera eta dokumentu bana emanda esateko erantzuna dokumentu horretan dagoen edo ez, eta erantzuna dokumentuan baldin badago, esateko zehazki non dagoen.
Erraz merkaturatu daitekeen prototipoa da
Pozik gaude ikerketan lortu dituzten emaitzekin. sperimentu horietan aztertu ditugun teknika eta ebaluazioetatik emaitzarik onenak eman dituztenak erabili ditugu prototipoan. Oinarri teknologiko sendoa ezarri dugu ikertzaileok, eta zenbait argitalpen zientifiko argitaratu ditugu horrekin lotuta. Premiazko informazio-beharrak daudenean bilaketak egiteko beste modu bat lortu dugu, informazioa kontsumitzeko prozesua errazten duena. Ikertzaile gisa frogatu dugu guk proposatzen dugun teknologia posible dela, eta sistemak emaitza onak ematen dituela.
Oinarrizko ikerketa-proiektu bateko emaitza-prototipo bat lortu dugu, ez da produktu komertzial bat. Baina horrelako prototipoak erraz eta denbora gutxian molda daitezke, merkaturatu eta jendearen esku jarri ahal izateko. Adimen artifizialari esker gero eta tresna ahaltsuagoak izango ditugu eskura dokumentu-base handiekin lan egiteko, izan ere, arlo honetan oso azkar ari gara aurrera egiten, eta, gainera, ikertzen den hori erraz iristen da merkatura.
Erreferentzia bibliografikoa
Arantxa Otegi, Iñaki San Vicente, Xabier Saralegi, Anselmo Peñas, Borja Lozano, Eneko Agirre
Information retrieval and question answering: A case study on COVID-19 scientific literature
Knowledge-Based Systems
DOI: 10.1016/j.knosys.2021.108072