Opentrad itzultzaile automatikoa (taldeko lana)

Egileak: Irati Garaioa, Idoia Ibarlucea eta Amaia Navarro

Sarrera

Opentrad itzulpen automatikoko sistema da eta 2006ko maiatzean aurkeztu zen Kataluniako Unibertsitate Politeknikoan. 20 hizkuntza-bikote baino gehiagoren arteko itzulpenak egiten ditu. Gero eta erabilera zabalagoa dauka Opentrad itzultzaile automatikoak, eta  erabiltzaile, enpresa eta erakunde publikoek zeregin hauetarako erabiltzen dute: testuak eta dokumentuak itzultzeko, Interneten hizkuntza desberdinetan nabigatzeko, eta abar. Itzultzaile automatiko honek beste aukera batzuk ere eskaintzen dizkie zenbait erabiltzaileri, hala nola, beren web-orri pertsonalak, enpresako web-orriak, blogak, eta abar ingelesez, gaztelaniaz, galegoz, portugesez, katalanez, eta abarrez jartzea.

 

Helburua

Opentrad proiektuaren helburu nagusia itzulpen automatikoko bi gailu edo motor garatzea izan da. Horietako bat hizkuntza ahaideko bikoteentzat da, transferentzia sintaktiko partziala egiteko; bestea berriz, transferentzia sintaktiko osokoa, elkarrengandik urrutiago dauden hizkuntz bikoteentzat. Beraz, proiektuaren azken helburua eskaintzen dituen hizkuntza-bikoteen arteko itzulpenak egiteko gai den sistema-prototipoa sortzea da.

 

Babeslea eta bultzatzailea

2004.urtean hasi zituzten sistema honen sortze-lanak. Garai honetan proiektu honek zazpi partaide zituen: Eleka Ingeniaritza Linguistikoa, Vigoko Unibertsitateko Informatika Hizkuntzalaritzako Mintegia, Alakanteko Unibertsitateko Transducens taldea, Kataluniako Unibertsitate Politeknikoa (TALP), Euskal Herriko Unibertsitateko Ixa taldea, Imaxin Software eta Elhuyar Fundazioa.

Gaur egun, Opentrad Partzuergoa imaxin software eta Eleka Ingeniaritza Linguistikoa enpresek osatzen dute. Imaxin Software software eta multimediako I+G+b arloko soluzio eta zerbitzu aurreratuak eskaintzen dituen enpresa da eta ingeniaritza linguistikoan, lokalizazioan eta hezkuntzarako multimedia produktuetan aditua da. Eleka Ingeniaritza Linguistikoa ingeniaritza linguistikoaren arloan I+G+b proiektuak lantzen dituen enpresa da, batez ere garapen eta berrikuntza arloetan.

 

Hizkuntzak

Aipatu bezala, Opentrad sistemak 20 hizkuntza-bikote baino gehiago itzultzen ditu. Opentrad Partzuergoari, unibertsitateei edota komunitateei esker lortu da  hizkuntza desberdin hauetara itzuli ahal izatea. Hona hemen horietako batzuk:

  • Gaztelania-Errumaniera
  • Gaztelania-Ingelesa
  • Gaztelania-Frantsesa
  • Gaztelania-Katalana
  • Gaztelania-Galegoa
  • Gaztelania-Portugesa
  • Gaztelania-Euskara
  • Frantsesa-Katalana
  • Okzitanoa-Katalana
  • Okzitanoa-Gaztelania
  • Ingelesa-Katalana
  • Ingelesa-Esperantoa
  • Ingelesa-Galegoa
  • Galesa-Ingelesa
  • Esperantoa-Gaztelania
  • Esperantoa-Katalana
  • Bretoia-Frantsesa
  • Portugesa-Katalana
  • Portugesa-Galegoa
  • Norvegiera Nynorsk- Norvegiera Bokmal

Abantailak

 Ugariak dira Opentrad itzultzaile automatikoak eskaintzen dizkigun abantailak. Hauexek dira aipagarrienak:

  • Opentrad, integratzen erraza: edozein sistemarekin integratzeko aukera ematen du, eta itzultzaile hau darabilen bezero bakoitzaren beharretara egokitzen da. Dokumentu asko, hainbat hizkuntzatakoak, erabiltzen dituzten erakundeei zuzendua dago.
  • Opentrad, kalitatea eta pertsonalizazioa: Opentrad, bezero bakoitzaren terminologia-beharretara pertsonalizatu eta egokitu daiteke. Eskaintzen duen hizkuntza-kalitatea dela eta, enpresa eta erakunde publiko gehiagok darabilte sistema hau.
  • Opentrad, azkartasuna itzulpenetan: itzultzaile automatiko honek berehala itzultzen ditu testuak, dokumentuak, web-orriak eta abar.
  • Opentrad, lizentziarik gabe: teknologia-inbertsioak optimizatzeko aukera ematen du. Kostuak aholkularitzatik eta bezero bakoitzaren beharretara pertsonalizatu eta egokitzetik eratorritakoak dira.

 

Erabilera gomendioak

Opentrad itzultzaile automatikoaren Web orrialdean ondorengo gomendio hauek aurki ditzakegu sistema hau ahalik eta hoberen erabiltzeko:

  1. Itzulpena egin aurretik testu originala zuzendu, testu originalean dauden akatsek itzulpenaren kalitatean eragina izan dezaketelako.
  2. Esaldi laburrak eta sinpleak erabiltzea komeni da hauek itzulpenak zuzenak izaten laguntzen dutelako, horrela esaldi anbiguoak ere saihestuz.
  3. Puntuazioa eta sintaxia zaindu egin behar dira, azken batez, adierazi nahi dena ongi ulertzeko eta transmititzeko ezinbesteko elementuak dira
  4. Itzultzaile automatikoak testua ongi ulertu dezan lagunarteko esamoldeak eta esaera idiomatikoak saihestu behar dira, nahasmena sor dezaketelako.
  5. Funtsezkoa da itzulpena berrikustea prozesu automatizatuek hizkuntza soildu egin dezaketelako.

 

Adibideak

Opentrad itzultzaile automatikoaren funtzionamenduan sortzen diren akatsak frogatzeko zenbait artikulu hartuko ditugu. Lehenengo eta behin, bi artikulurekin egingo dugu froga, lehenengoa gaztelaniatik euskarara eta bigarrena euskaratik gaztelaniara itzuliz.  Azkenik, gaztelaniazko abesti bat euskaratu egin dugu.

1. Lehenengo testua Gara egunkaritik (2011-04-13) hartu dugu, eta hau da:

“El seísmo ha tenido lugar a las 10:08 hora local (02:08 GMT) con su epicentro localizado a diez kilómetros de profundidad en el sur de Fukushima, donde ha alcanzado una intensidad de grado 4 en la escala japonesa de siete puntos, que se centra más en las zonas afectadas. El terremoto no ha obligado a evacuar la planta nuclear de Fukushima Daiichi ni ha detenido las labores de enfriamiento de sus reactores, según ha informado la televisión pública NHK. Parte de los operarios de Fukushima se concentran hoy en drenar el agua contaminada que inunda varias zonas de las instalaciones del reactor 2, según NHK”.

“Seismoa gertatu da 10:08 ordu lokal (02:08 GMT) sakontasunaren 10km-ri Fukushimaren hegoaldean haren epizentro aurkituarekin, intentsitate bat lortu duen leku gogoz lau zazpi puntutako japoniar eskalan, gehiago erdiratzen den inguru eragin. Lurrikarak Fukushima Daiichiren planta nuklearra ebakuatzera ez du behartu ere haren erreaktoreen hoztearen lanak gelditu ditu, NHK telebista publikoa informatu du. Fukushimaren langileetako batzuk gaur kontzentratzen dira erreaktorearen instalazioen bi zenbait inguru urpetzen duen ura, drainatu kutsatuta NHK-ren arabera”.

Egin diren akatsak aztertzeko maila morfosintaktikoa eta maila lexikoa hartuko ditugu kontuan.

Maila morfosintaktikoa:

  • Euskarazko itzulpenak gaztelaniazko artikuluaren orden bera jarraitzen du, lehenengo esaldi honetan argi ikus daitekeenez: el seísmo ha tenido lugar a las 10:08 hora local (S-V-O) eta seismoa gertatu da 10:08 ordu lokal (S-V-O). Baina euskarazko ordenak S-O-V izan beharko luke.
  • Ezagutzen ez dituen hitzak bere horretan itzuli ditu, hitza deklinatu barik, adibidez: a las 10:08 hora local eta 10:08 ordu lokal.
  • Deklinabide kasuak ez ditu bereizten:

                          -Adlatibo eta datiboaren arteko bereizketarik ez du egiten adibide honetan: a diez kilómetros eta 10km-ri.  Adlatiboak egon beharko lukeen tokian, 10km-ra, datiboa erabiltzen du.

                          -Ondorengo adibide honetan ere itzultzaile honek akats bat egin du hitz bat deklinatzerako orduan: con su epicentro localizado epizentro aurkituarekin itzuli du, hau da, soziatibo kasua aditzari gehitu dio.

                          -Genitiboa eta leku-genitiboa nahastu dira adibide honetan: Fukushimaren langileetako erabili du Fukushimako langileetako erabili ordez.

                          -Kasu batzuetan ergatibo kasua ez da agertzen. Esaterako, NHK telebista publikoa informatu du.

  • Labores de enfriamiento, hoztearen lanak gisa itzuli du. Euskaraz hitz elkartu baten bidez adieraziko genukeena (hozte-lanak)itzultzeko, egitura sintaktiko batez baliatu da sistema hau.
  • Ezezko esaldiak sortzeko egitura sintaktikoan egokia ez den partikula bat erabili du: ere partikula ezta partikularen ordez: ez du behartu ere haren erreaktoreen hoztearen lanak.
  • Egitura aldetik, erreaktorearen instalazioen bi zenbait inguru urpetzen duen ura, drainatu kutsatuta esaldia guztiz okerra da eta ezinezkoa da esaldiaren zentzua ulertzea.

Maila lexikoa:

  • Zenbait hitz itzultzerakoan aukeraketa okerra egin da; izan ere testuinguru batzuetan sinonimoak diren hitzak erabili dira baina testu honetarako egokiak ez direnak. Adibidez: erdiratu eta centrar (areagotu izango lizateke aukerarik egokiena); afectadas eta eragin (kaltetuak) ; evacuar eta ebakuatu (hustu).
  • Euskarazko itzulpenean leku gogoz  hitzak erabiltzen dira baina ez dakigu zeri egiten dioten erreferentzia gaztelaniazko testuan.

2. Bigarren testua Berria egunkaritik (2011-04-17) hartu dugu:

“Donostiako Bulebarrean amaituko da gaur Korrika, auzo guztiak igaro ondoren. Milaka euskaltzalek espero duten unea iritsiko da: Korrika osoan zehar lekukoaren barruan joan den leloa irakurtzekoa. Aldi guztietan bezala, festari amaiera emateko, egun osoko jaia izango da ondoren”.

“Donostiako el próximo día bulebarrean hoy ha después de pasar, corriendo todos los barrios. Miles de euskaltzalek se espera año: el momento por todo el corriendo dentro del testigo el lema que se ir irakurtzekoa. , como en todos tiempo el final festari para dar fiesta de todo el día después de será”.

Aurreko adibidean bezalaxe, akatsak aztertzeko maila morfosintaktikoa eta maila lexikoa erabiliko ditugu:

Maila morfosintaktikoa:

  • Deklinatuta dauden hitzak ez ditu gaztelaniara itzultzen, ez dituelako ezagutzen. Esaterako: Donostiako, bulebarrean, euskaltzalek, irakurtzekoa, festari.
  • Amaituko da eta iritsiko da aditzak ez dira gaztelaniazko testuan itzulita agertzen.
  • Badira ere zenbait elementu euskarazko testuan agertzen ez direnak eta gaztelaniazko itzulpenean badaudenak: hoy ha después de pasar eta se espera año.
  • Gaztelaniazko itzulpenean ir aditza ez dago jokatua. Erlatibozko esaldia zuzena da, baina aditz nagusia ez: joan den leloa -> el lema que se ir.
  • Esaldiak ez daude ondo egituratua eta horrek ulermena zailtzen du. Esate baterako: para dar fiesta de todo el día después de será.

Maila lexikoa:

  • Korrika hitza ondo itzulita dago, itzultzaileak aditzondo gisa antzeman eta horrela itzuli duelako (corriendo) baina itzultzaile automatikoa ez da gai izan lexikalizatutako eta izen berezi bihurtutako aditzondoa dela antzemateko. Ezin du jakin Korrika zer den eta horregatik itzuli du aditzondo gisa.
  • Aldi itzultzerakoan aukeraketa okerra egin du, tiemporen ordez beste hitz bat aukeratu beharko zuelako testuinguru horretarako egokiagoa izango litzatekeena.

3. Hirugarren testua Los Ronaldos taldearen “No puedo vivir sin ti” abestitik atera dugun zati bat da:

 ”Llevas años enredada en mis manos,
en mi pelo, en mi cabeza,
y no puedo más, no puedo más.
Debería estar cansado de tus manos,
de tu pelo, de tus rarezas,
pero quiero más, yo quiero más.

No puedo vivir sin ti,
no hay manera,
no puedo estar sin ti,
no hay manera”.

“Urteetan daramazu nire eskuetan korapilatua,
nire ilean, nire buruan,
eta gehiago ez ahal dut, gehiago ez ahal dut.
Zure eskuetatik nekatu,
zure ilearen, zure arrarotasun,
baina nahiago naiz, nik nahiago naiz.

Zu gabe ez dut bizi izan ahal,
era ez dago,
zu gabe ez naiz egon ahal,
era ez dago”.

Oraingo honetan akatsak maila morfosintaktikoan baino ez dira ematen.

Maila morfosintaktikoa:

  • Lehenengo akatsa (urteetan daramazu) gramatikalki zuzena da baina ulermen eta erabilera aldetik egokiagoa izango litzateke ondorengo hau: urteak daramatzazu.
  • Bigarren akatsa guztiz gramatikala da : no puedo más itzultzeko ezin dut gehiago beharrean ez ahal dut itzuli du.
  • Hirugarrena deklinabide-akatsa da:  cansado de tus manos itzultzeko zure eskuez nekatuta izango litzateke egokiena, baina zure eskuetatik nekatuta itzuli du. Hau da, ablatiboa erabili du kasu hau erabili behar ez zuenean.
  • Gaztelaniazko testuan deberia estar azaltzen da, ez, ordea, euskarazkoan. Hots, ezabatu egin dute.
  • Bosgarren akatsa aditzean ematen da: alde batetik, aditza dago gaizki itzulita testuinguru honetan ez baitu eman nahi izan dioten zentzua: quiero más esateko gehiago nahi dut izango litzateke egokia eta ez nahiago naiz. Bestalde, aditz-laguntzailea ere gaizki erabilita dago: nahiago dut izan beharko litzateke eta ez nahiago naiz. Azkenik, aditzarekiko komunztadura ere hautsi egiten da: ergatibo kasua erabili da beharrezkoa ez denean: nik nahiago naiz.
  • Seigarren akatsean gramatika aldetik daude arazoak: no puedo vivir itzultzeko ez dut bizi ahal erabili dute eta ezin dut bizi litzateke forma egokia.
  • Azken akats honetan arazoa ordenarekin eta deklinabidearekin dago, partitiboarekin zehazki. No hay manera esateko ez dago erarik izango litzateke itzulpen egokiena baina era ez dago itzuli da.

 

Bibliografia

Advertisements