Itzultzaile automatikoak (erdaratu.eu)

Naroa Perez eta Esti Blanco

Guk aztertuko dugun itzultzaile automatikoak “Erdaratu.eu” izena dauka. Orain dela gutxi sareratu zen eta apertium-eu-es sistema erabiltzen du, hortaz, euskaratik espainierarako Apertium plataforman oinarritutako itzultzaile automatiko librearen lehenengo bertsioa dugu: eta erdaratu.eu webgunean probatu daiteke.

Lehenik eta behin, proiektuari buruzko informazio orokorra eskainiko dugu, gure ustetan garrantzitsua baita honen funtzionamendua ulertzeko. Apertium-eu-es itzulpen automatiko proiektu handiago baten parte da: Apertium (www.apertium.org ) izeneko proiektuaren parte, hain zuzen. Apertium proiektuak, hizkuntza batetik bestera testuak itzultzeko softwarea garatzen du.

Azken hilabeteetan, Mireia Ginest aritu da Apertium-eu-es garatzen, Alacanteko Unibertsitateak, eta, batez ere, Prompsit Language Engineering (www.prompsit.com) enpresak finantzatuta. Prompsit-eko Sergio Ortizek eta Francis Tyersek eta Alacanteko Unibertsitateko Mikel Forcadak lagundu diote. Une honetan, apertium-eu-es itzulpen automatikoak gutxi gora behera 6.000 hitz eta 250 gramatika-arau dauzka. Hiztegiaren zati handi bat beste proiektu libre batetik hartua da, Matxin espainiera-euskara itzultzaile-prototipotik. Erregela guztiak Apertiumen idatzi dira.

Apertium-eu-es testu baten esanahi orokorrari buruzko ideia bat egiteko balio dezake (baldin eta sistemak hitz ezezagun gehiegi aurkitzen ez badu testuan).

Behin informazio hau eskaini eta gero, guk egindako proba ezberdinen berri emango dugu. Guk zenbait esaldi itzultzen saiatu ginen emaitzak zelangoak ziren ikusteko eta ondorengo emaitzak ikusi genituen:

– “nik ez dut pentsatzen bihar eguraldi ona egingo duenik”

– “Yo no pienso mañana el tiempo bueno hará que”

Hauek dira itzultzaileak ematen dituen emaitzak. Hitz ordena nabari ez zuzena dela jarraian ikus dezakegu, beraz, pentsa genezake sintaxiaren arazo bat daukala. “Pentsatzen” hitza “uste”rengatik aldatuz gero (nik ez dut uste bihar eguraldi ona egingo duenik) jartzen badugu hain zuzen ere, emaitzaren hitz ordena berdina izaten jarraituko du:

– Yo no tengo suposición mañana el tiempo bueno hará que

Eta “nik” beharrean “zuk” jarriz gero ere, emaitza berdina izango da baina “Tú no tienes suposición mañana el tiempo bueno hará que” jarriko du. Beraz, adibide honetako gure ondorioa da itzultzaileak badakiela izenordainak bereizten (ni eta zu bereizten baititu itzulpenean) eta bada gai era berean “pentsatzen” eta “uste” artean desberdintzeko, baina bi arazo daude:

1- Batetik itzultzaileak ez du ondo harrapatzen “uste”  hitzaren zentzua. Berak “tener suposición de” bezala itzultzen du eta hiztunarentzako “creer” zentzua dauka kasu horretan.

2- Hitz orden erratua. Hitzak gaztelerara ez ditu dagozkion lekuan kokatzen. Elementuak dauden horretan kokatzen ditu, ordena euskeraz ondorengoa da:

Izord (zuk) + ez + adlag (duzu) + adnag (uste) + denbora adond (bihar)+ izena (eguraldi) + izlag (ona) + adnag (egingo) + adilag (duenik).

eta gazteleraz ere, orden hori mantentzen du, baina gaztelerazko hurrenkera errespetatu barik hortaz.

Izord (tú) + no + adlag (tienes) + adnag (suposición) + denbora adond (mañana) + izena (tiempo) + izlag (buen) + adnag (hará)

Beste adibide bat jarriko dugu lehenengo bidetik jarraituz.

“Zuk uste duzu bihar eguraldi ona egingo duela?” Hau jarritakoan, lehenengo esaldia galdera bihurtu dugu eta itzulpena honakoa izan da: “Tú crees mañana el tiempo bueno hará ,?”. Adibide honetatik atera dezakegun ondorioa da “uste + izan” aditz osoa jarriz gero itzultzaileak harrapatzen duela aditz baten aurrean gaudela (creer) eta ez izen baten aurrean aurreko kasuan bezala (suposición), beraz, zerbait hobetu da egoera. Gainontzeko elementuek aldiz, orden ez egoki horretan mantentzen dira.

Gure ustetan, aurretiaz azaldutako guztia dela eta, itzultzaile hau erabilgarria izan daiteke batez ere euskara ikasten ari diren pertsonentzat, testuari zertaz ari den antzemateko, zehazki aztertu baino lehen eta euskaraz ez dakitenentzat, nahi izanez gero euskarazko komunikabideen albisteak ulertu ahal izateko

Apertium proiektua irekia denez (Apertium-en garatzen den software guztia GPL lizentzia librea du), era askotan lagundu dezakegu Apertium-eu-es hobetzeko. Honaino egindako aurrerapenei buruzko iruzkinak egiteko aukera dago eta bertsio berriak probatzen ere lagun diezaiekegu. Era beran, hiztegietan hitzak sar daitezke, eta gramatika-erregelak sortzen lagundu, irteeran hitz-ordena zuzenagoa lortzeko. Gure ustetan, hau da batez ere, itzultzaile honek eskaintzen duen abantailarik handiena, itxi ez denez etengabe hobetzen joateko aukera dago eta gainera, erabiltzaileari parte hartzeko eta amaierako produktuaren parte izateko aukera eskaintzen ere bai. Hau da gure ustetan etorkizuna izan beharko lukeena, software librearen eta jendearen asmo onez eta ekarpenez funtzionatuko duten proiektuak.

Advertisements

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Google+ photo

You are commenting using your Google+ account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s