IÑAKI LETURIA. Elhuyar Fundazioa: Inma, hemen egiten duzuen lana da gizakiak eta makinak elkarrekin komunikatzeko eta elkar ulertzeko teknologia sortu, ezta?
INMA HERNAEZ, Aholab laborategia (UPV/EHU): Bai, elkarrekin berba egiteko.
IÑAKI LETURIA. Elhuyar Fundazioa: Eta nola egiten da hori?
INMA HERNAEZ, Aholab laborategia (UPV/EHU): Alde batetik, ahotsa sortzen dugu testu batetik abiatuta, algoritmo batzuk erabiliz, eta gero, beste alde batetik, ezagutza, ahotsa hartzen dugu, aztertu eta dagokion testua sortu.
Entzuten ari zareten honetan makina bat ari da hizketan; ez da grabazio bat. Berbaldia ahots-sintetizagailu batek sortzen du, Aholabek garatutako teknologia batek. Aholab da ahots-teknologiak garatzen dituen Euskal Herriko Unibertsitateko laborategi bat. Orain arte, gizakia eta makina idatziz komunikatu dira, botoiak tarteko; baina gaur hasiak gara smartphonei edo tabletei hitz egiten, eta haiek erantzun eta agindutakoa betetzen dutela, gainera.
IÑAKI LETURIA. Elhuyar Fundazioa: Android sistema eragileak dakarren ahots-teknologiarekin jolastuko dugu orain apur bat. Ea elkar ulertzen dugun.
Webgune batera zuzenean jo, mapa jakin bat ireki, GPSa programatu... hori guztia ingelesez, gaztelaniaz edota gainerako hizkuntza handiak erabiliz bakarrik egin daitezke. Aholab lanean ari da makinek euskaraz ere egin dezaten. Bereziki ahots-sintesia lantzen du: TTS, Text To Speech delakoa. Hauek dira pausoak.
INMA HERNAEZ, Aholab laborategia (UPV/EHU): Bai, hori daukazu alde batetik, modulu linguistikoak, eta, beste alde batetik, eredu akustikoak behar dituzu; eta gero algoritimo batzuekin …
IÑAKI LETURIA. Elhuyar Fundazioa: Sofware deituko diogu jendeak uler dezan
INMA HERNAEZ, Aholab laborategia (UPV/EHU): Bai, software batekin soinuak lotu eta handik ahotsa atera, ahal bezain ondo edo natural.
IÑAKI LETURIA. Elhuyar Fundazioa: Naturaltasuna, hori da, beharbada, erronka?
INMA HERNAEZ, Aholab laborategia (UPV/EHU): Hasieran, ulergarritasuna zen erronka, duela urte asko. Gero, sistemak oso ulergarriak ziren, eta naturaltasuna zen erronka. Eta gaur egun, naturaltasuna baino gehiago, ahots sintetikoan emozioak jartzea.
Berbaldia osatzen duten oinarrizko elementuak, sintesi-unitateak edo fonemak audioko edo bideoko horrelako grabazioetatik eskuratzen dira. Hemen, hizlariaren aurpegia ere grabatu zen, emozio bakoitzari zegokion keinua jasotzeko.
Berbatek proiektuaren adarretako bat da bikoizketa automatikoa egiteko demo hau. Elhuyar Fundazioko Igor Leturia ikertzaileak garapenean parte hartu du.
IGOR LETURIA, Elhuyar Fundazioa: Hau da Berbatek proiektuaren barruan egin dugun demo bat, erakusteko hizkuntza-teknologiek, kasu honetan, nola lagundu diezaioketen itzulpenaren sektoreari, bikoizketak egiteko hain zuzen.
IGOR LETURIA, Elhuyar Fundazioa: Hau da guk hartu dugun jatorrizko bertsioa, gaztelaniazkoa. Abiapuntua gaztelaniazko bideo bat da, bideoa eta haren transkripzioa. Hortik automatikoki sortzen da azpitituluen fitxategi bat, hau da, esaldi bat noiz hasi eta noiz bukatzen den. Eta, gero, gaztelaniazko azpititulu-fitxategi hori euskarara itzultzen da automatikoki, eta euskarazko audio edo ahotsa sortzen da, berriro automatikoki.
IGOR LETURIA, Elhuyar Fundazioa: Transkripziotik azpitituluak erauzteko teknologia Vicomtech-ena da, itzulpen automatikoa IXArena eta ahotsaren sorkuntza edo sintesia Aholabena.
IGOR LETURIA, Elhuyar Fundazioa: Hemen aukeratuta ditugu euskarazko audioa eta euskarazko azpitituluak. Orain entzuten eta irakurtzen ari garena da automatikoki euskarara itzulitako azpititulu horiek eta ahotsa da Aholaben sintesi-teknologiarekin automatikoki sortutakoa
IÑAKI LETURIA. Elhuyar Fundazioa: Magia esan dut nik, ez dakit hala den...
IGOR LETURIA, Elhuyar Fundazioa: Bai, magiko xamarra da.
Teknologia hauek erabiliz egin daitekeenaren adibide edo demo bat baino ez da, baina, imajinatu, errusieraz dagoen pelikula bat zuzenean euskaraz entzuteko lehen pausoa izan daiteke. Ahots-sintesiaren aurrerabidea abiada bizian doa.
IÑAKI LETURIA. Elhuyar Fundazioa: Kaixo, Inma, nire ahotsa neska-ahots bihurtuko dugu... edo amona baten ahotsa, adibidez, Gauza zailak jarri dizkiogu.
Ahots-sintesi aurreratuak askotariko erabilerak izan ditzake: marrazki bizidunetako pertsonaiei ahotsa jartzeko, adibidez. Ebakuntza edo gaixotasun bat dela medio ahotsa betiko galduko duen norbaitek grabazioak egin ditzake aurretik, eta, gero, audio hori erabili ahots-sintetizagailuak, lehen zuen ahotsaren berdin-berdina sor dezan. Edo TB modu merkean egiteko bideak ere ari dira aztertzen: berriak makina batek irakurriko lituzke; adibidez, eguraldiaren iragarpena.
Berbateken beste demo honetan ahots-sintesiaz gainera ezagutza ere sartzen da jokoan. Hizkuntza- eta ahots-teknologiek irakaskuntzan izan dezaketen erabilera frogatu nahi zen hemen.
Ahotsaren ezagutzak, gutxi gorabehera, sintesiaren kontrako bidea egiten du. Ahotsa testu bihurtzeko lehengaia ematen zaio hasieran , adibidez, 43 osatzen duten unitate akustikoak, soinu-zatitxoak.
INMA HERNAEZ, Aholab, UPV/EHU: 43, berrogeita hiru. Ulertu du.
Eta, gero, elementu horiek nola antolatuta jaso ditzakeen esan behar diozu makinari, hizkuntza-ereduak eman.
IÑAKI LETURIA. Elhuyar Fundazioa: Zuek esaten diozue zeri buruz hitz egingo dugun, gutxi gorabehera; "zenbakiak bakarrik esango dizkizut", abisatzen diozue makinari
INMA HERNAEZ, Aholab laborategia (UPV/EHU): Lexikoa finkatzen duzu, bai, eremua mugatu. Gero egin dezakezu apur bat konplikatuagoa, eta gramatika sartu, adibidez, baina gramatika ere mugatua, ezagutu dezan "non jaio zen Newton"
Kargatuta ez duen lexikoa edo hizkuntza erabiliz hitz egiten badiozu, sistema ez da gai izango ulertzeko.
IÑAKI LETURIA. Elhuyar Fundazioa: Eta pertsona bati bezala hitz egingo banio, hizkera jarraituan? "Zer iruditzen afaltzera joango bagina?", ulertuko luke?
INMA HERNAEZ, Aholab laborategia (UPV/EHU): Bai, ulertuko luke, baldin eta lengoaia-ereduak badauzka. Lengoaia-ereduak eredu linguistikoak dira, hitz-kateen probabilitateak kalkulatzeko estatistikoak, eta hori egiten da testu asko hartuz … hitzen arteko erlazio estatistikoak eta kateen probabilitateak kalkulatzen dira. Eta informazio horrekin guztiarekin eraikitzen dira eredu linguistikoak.
Lan hori egiteko Interneten, adibidez, eskura daitekeen testu-kantitateak baldintzatzen du, besteak beste, hizkuntza baten garapen-maila arlo horretan. Hor ere hizkuntza handien eta txikien arteko tartea begi-bistakoa da.
IGOR LETURIA, Elhuyar Fundazioa: Hizkuntza bat ez badago prestatuta, gauza horiek eskuz egiten jarraitu beharko du, eta atzera ibiliko gara teknologian. Horregatik da hain garrantzitsua horrelako gauzak garatzea.
Ahots-teknologiak erabiltzen hasi baino ez dugu egin. Noraino irits gaitezkeen? Adibidez, nola dakizue erreportaje honi ahotsa jarri diona gizakia ala makina den?