Hizketa ezagutzeko sistemak etengabe hobetzen
Ingurune zaratatsuetan euskara, gaztelania eta ingelesa ezagutzeko eta hiztunak ezberdintzeko sistema garatu dugu Europako SERMAS proiektuaren barnean
Orairen ildo nagusietako bat da hizketaren ezagutzarena, eta etengabe ari da ikertzen ASR (Automatic Speech Recognition) teknologia hobetzeko. Laguntzaile birtualekin ahoz komunikatzea, bideoak automatikoki azpititulatzea, hitzaldiak transkribatzea, irakurtzen laguntzeko tresnak garatzea… Askotariko aukerak eskaintzen ditu hizketa-ezagutzak. Europako SERMAS proiektuaren barnean, bost hizkuntzatan ibiliko den sistema bat garatzen ari da Orai, ingurune zaratatsuetan erabilgarri izango dena eta hiztunak ezberdintzeko gai izango dena.
SERMAS proiektua (Socially-acceptable Extended Reality Models and Systems) ikerketa- eta berrikuntza-proiektu bat da, Horizon Europe programaren funtsekin finantzatua eta hainbat eragileren artean gidatua. Sozialki onargarriak diren errealitate hedatuko (XR) eredu eta sistemak garatzea du xede. Errealitate hedatuko sistemak dira mundu fisikoa eta digitala konbinatzen dituzten murgiltze-teknologia guztiak, errealitate areagotua, errealitate birtuala eta errealitate mistoa barne.
SERMASen helburua da laguntzaile adimendun edo birtual aurreratuak eraikitzea hainbat esparrutarako, puntako adimen artifizialaren ikerkuntzaren eta garapenaren bidez. SERMAS proiektuaren barnean, LANGSWITCH azpiproiektuan dabil Orai (Multilingual Automatic Speech Recognition in Noisy Environments).
“Ahotsa ezagutzeko teknologia sortzen ari gara bost hizkuntzatan (euskara, gaztelania, frantsesa, ingelesa eta italiera), zarata handiko giroetan erabiltzeko eta hiztunak bereizteko garatua. Laguntzaile birtual, abatar, robot, elkarlaneko robot eta errealitate areagotuko sistemetan aplikatu ahal izango dira hizketa-ezagutzaile horiek, makinaren eta gizakiaren arteko elkarrekintza errazteko. Gainera, pertsonalizazio-maila handitzeko aukera ahalbidetuko dugu ahotsa baliatuz erabiltzaileak bereizteko sistema baten bidez. Esaterako, kontuan hartu ahal izango dira erabiltzaile jakin baten makinaren erabilera-historiala edo hobespenak”, azaldu du Iñigo Morcillo, Oraiko ikertzaileak.
Lehenengo fasean, ingeleserako ASR sistema baliozkotu du Oraik. Oso emaitza onak izan ditu, Igor Leturiak, Oraiko hizketa-teknologien arduradunak, adierazi duenez: “Whisper eredua hobetzea lortu dugu” (ahotsa transkribatzeko eta ezagutzeko OpenAIk sortutako ikaste automatikoko eredu bat da Whisper). Bestalde, Oraiko lantaldeak API baten edo aplikazioak programatzeko interfaze baten bidez jarri du SERMAS proiektuaren eskura ASR sistema hori.
Proiektuaren bigarren fasean, Oraiko lantaldeak euskara eta gaztelania ingurune zaratatsuetan ezagutzeko sistemak garatu eta baliozkotu ditu. “Hirugarren fasean hizlariak ezberdintzeko sistema garatu dugu. Agente birtualetan erabiltzaile-aldaketa ote dagoen edo erabiltzaile posible ezberdinen artean une batean hizketan nor ari den jakiteko sistema da, eta hainbat hizkuntzatan funtzionatzen du —dio Leturiak—. Orain laugarren fasean sartu gara, ingurune zaratatsuetan ere ongi ibiliko den hizketa-ezagutzako sistema frantsesez eta italieraz landuko dugu, eta guztia biribildu”. Azken emaitza, beraz, ingurune zaratatsuetan 5 hizkuntzatan ibiliko den (eu, es, fr, it, en) ASR sistema izango da eta hizlariak ezberdintzeko gai izango dena, eta SERMASeko sistemek erabiltzeko moduan jarriko da hori guztia.
Informazio osagarria
SERMASen partzuergoa honako hauek osatzen dute: Università Degli Studi di Modena e Reggio Emilia (UNIMORE, Italia), Technische Universitat Darmstadt (Alemania), King 's College London (Erresuma Batua), University of Applied Sciences and Arts of Southern Switzerland (SUPSI, Suitza), Deutsche Welle (Alemaniako irrati-zerbitzua), Poste Italiane (Italiako posta-zerbitzua), F6S (mundu osoko sektore publikoko erakundeei proiektu teknikoak eta ikerkuntzakoak sustatzen, komunikatzen eta zabaltzen laguntzeko mundu mailako sarea) eta Spindox Labs (ikerkuntza teknologikoan eta prototipoen sorreran diharduen Trentoko (Italia) berrikuntza-zentroa). SERMASen partzuergoak erakunde berritzaileak, puntako teknologiako enpresa berriak, ETEak eta eragile industrialak erakartzeko egindako deialdi baten bidez sartu da Orai proiektuan.