Tatoeba Project

In linguistics, corpora (plural form of “corpus”) are large sets of language samples taken from real-life texts in a given context. Usually, they attempt to capture everyday speech in ordinary situations (although they can be more specific, e.g. samples of English essays written by non-native students), and thus can then be studied to analyze the characteristics of natural language, to extract statistics on the use of certain expressions or common errors, or to guide learners of a particular language by representing how native speakers would generally express themselves.

Tatoeba (Japanese for “for example”) is an ongoing non-commercial collaborative project to collect sentences from and translated into many different languages. Started in 2006, it currently serves as a cross-lingual aligned corpus with more than 750000 sentences distributed among more than 80 languages.

Tatoeba is an online and open language resource, whose data is available to anyone and can be accessed through the website’s multilingual interface (e.g. Japanese homepage, Basque homepage, Arabic homepage). Sentences are released under the Creative Commons license and can be downloaded as a .csv file, so that they can be freely incorporated into other sites or even textbooks. Users can register to contribute either by providing written or audio-recorded sentences, new translations, comments, or correcting mistakes in spelling, grammar, etc.

Nevertheless, in order to make sure that the contents offered are of sufficient good quality to be employed educationally, Tatoeba has a few moderators that review user activity. In addition, not every person is immediately given the right to make any type of edit, and only those members who accumulate reliability through positive participation become “trusted users”.

How to use Tatoeba

Clicking on the “browse” tab, you can perform sentence searches in different ways:

1. By words:

Using Boolean logic operators, you can perform queries to look for sentences including a specific word, two or more specific words, some word among more than one alternative, only certain words but not others, exact matches of a string of words, etc.


2. By language:

You can look for a sentence in the language you want and decide whether to see all of its translations or only those appearing in a specific language.

National flags are used as symbols to indicate which language a sentence is written in.

If a single sentence can be translated into a language in many ways, users are allowed to submit all the translations they consider necessary. Tatoeba allows for near-duplicates as long as their presence is assistive.

You can also indicate whether you want to find a direct translation or an indirect one. Indirect translations are those that occur when a translation is again translated, and thus this 2nd translation is no longer directly connected with the original sentence.

Indirectly translated sentences could lose some nuances and might not be as accurate, but Tatoeba nevertheless accepts their submission.

As of March, 2011, the three top languages with most sentences on the database are (in order) English, Japanese and Esperanto.

3. By list:
Users can create public or private lists to group sentences within a category. Public lists are accessible to everyone, and include examples such as “tourist sentences (all languages)“, “sayings & idioms (all languages)“, “natural-sounding Spanish sentences“, etc.

4. By tag:
Many types of tags can be attached to sentences in order to help classify or define them. Tags are used to mark different aspects of a sentence, from semantic qualities (related to topics such as “weather“, “family“, etc.) to notes concerning usage (“female speaker“, “colloquial“, etc.). However, because there is currently no uniform tagging system, some tags are unnecessarily repetitive (e.g. “Plato“, “by Plato” and “By-Plato“), others are almost or completely unused (e.g. “quotation“, “most important“), and a few do not seem transparent enough (e.g. “651884“, “@©hange“).

5
. By user:

Sentences added or “owned” by a member can be found on their profiles.



Because not all users are as reliable or experienced, this feature helps you locate the most trusted contributions.

6. By audio:

Only those sentences for which an audio recording is available are displayed (at present totaling up to more than 9500).

Evolution

The enormous amount of sentences already submitted in less than 5 years proves Tatoeba‘s success. Although the database was at first taken from the Tanaka Corpus of parallel Japanese-English sentences, the collection has been widely modified, corrected, and expanded to include many more new sentences and other languages. While the project was started by a single person (who is still the only administrator on the site), there are now several moderators that also share the power to take care of the database through editing or deleting erroneous sentences.

Pageview statistics and the number of sentences submitted during the whole year of 2010 show that Tatoeba has seen a huge increase in popularity and activity in the span of a few months.

Tatoeba is currently a language resource checked by tens of thousands of people every day, but with its constantly growing community, we can be confident that the project will achieve much more in the course of time.

References:

  • Tanaka Corpus (February 3, 2011). In EDRDG Wiki. Retrieved March 13, 2011
Advertisements

Elhuyar hiztegiaren azterketa

Egileak: Naroa Perez eta Esti Blanco

Guk aukeratutako hiztegia Elhuyar hiztegia da, . Erreportaia honen hasieran Elhuyar fundazioari buruzko informazioa eskainiko dugu eta ondoren, kasu praktiko baten bidez, hiztegi honek dakartzan hobekuntza eta alde positibo denak azalduko ditugu. Elhuyar Fundazioak hizkuntza-baliabideak eta tresnak on line jarri zituen Interneten 2008. urtean. Web gune honen bidez, hizkuntzalariek, irakasleek, teknikariek eta, oro har, gizarteak Internet bidez ikusgai izango dute Elhuyar Fundazioak hizkuntza-zerbitzuen arloan lantzen dituen proiektu, zerbitzu eta produktuak. Elhuyarrek eskaintzen dituen zenbait zerbitzu eskuratu ahal izango ditu erabiltzaileak Internet bidez, besteak beste, hauek: hiztegi-kontsulta eleaniztuna, hiztegien plugin-ak deskargatu, telefono mugikorrerako euskara-gaztelaniazko hiztegi murriztua eskuratu, hizkuntza-kontsultak egin… Erabiltzaileek parte hartzeko modua ere bada honakoa, Hizkuntza Zerbitzuen blog-aren bitartez. Elhuyar Fundazioko I+G+B sailean egiten diren ikerketek ere leku berezia dute web gunean. Martxan jarritako ikerketa-ildo eta proiektuen informazioa emango du web guneak, eta argitaratutako artikulu guztiak kontsultagai jarri dira. Horrez gain, ikerketa-proiektuen emaitza diren baliabide eta tresnetara sarbide zuzena egongo da atari honetan: zientzia eta teknologiaren corpusa (berriki handitu da, eta kontsulta-aukera zabalagoa eskaintzen du), CorpEus (Internet euskarazko corpus gisa kontsultatu eta ustiatzeko tresna), OpenTrad (kode irekiko itzultzaile automatikoa) eta Elebila (euskarazko bilatzailea). Hiztegiak 85.000 sarrera inguru ditu bi atalen artean eta 120.000 adiera. Kopuru horiek berek adierazten digute hiztegiaren norainokoa. Izan ere, sarrera-kopuruari begira, bistan da ez garela oinarrizko lan batez ari, premia behinenak soilik asetzeko asmoz taxutua. Bi hizkuntzen masa lexiko esanguratsua bildu da, askotariko beharrak kontutan hartzearren. Hartara, lexiko arrunta eta orokorra landu da, historikoa zein gaur egungo lexiko ‘hiritartua’; horrekin batera terminologia teknikoak ere badu lan honetan bere tokia, guztira hirurogeita zazpi jakintza alorretako hitzak bildu direlarik. Ordainak ematerakoan, atal batean zein bestean ahalbait sinonimo gehien eskaintzen saiatu dira. Hau zuzenean euskalkien tratamenduekin dago. Euskalkiek euskara estandarrean tokia behar dutela aspaldi da euskaltzaleen artean onartua. Horrenbestez, gaztelaniazko hitzen ordain zerrendan euskalki-hitzak ere sartu dira, euskalki-markarik gabe sartu ere. Euskara-atalean berriz, direlako hitz horiek zein euskalkitakoak diren adierazita dago, dagokion markaren bidez. Bilatu nahi dugun hitzen euskal nahiz erdal ordaina eskuratzeaz gain beste baliabide bat ere eskaintzen digu aztergai dugun internet bidezko hiztegi honek. Aurrizki zein atzizki bereko hitzen zerrenda eskaintzen digu bertan azaldutako pausoak jarrituz gero. Baliabide hau oso baliagarria da hizkuntzak lantzen dituenarentzat corpus nahiko osoa eskuratzeko aukera baitago esfortzu handirik egin gabe. Esaterako, -tasun atzizkidun hitzen corpusa lortu nahi badugu (%tasun) idatziko dugu bilatzailean eta berehala zerrenda luze bat azalduko zaigu: Aurrizkiaren kasuan berdin jokatuko genuke, (des%) idatzi ostean honakoa lortuko genuke: Hemendik aurrera, kasu praktikoarekin hasiko gara. Askotan, itzulpenak egiten dihardugunean, hurrengo estiloko zenbait arazo topatzen ditugu: hitz baten erabilera ezberdinak, polisemia, aditz lokuzioak etab. eta honek itzultzeko konponbide argiak aurkitzea ez da horren erraza izaten.

Laburbilduz, elhuyar hiztegiak ondorengo ezaugarriak ditu:

– Elhuyar Fundazioa 1972an sortu zen elkartea dugu, teknologia bultzatzen eta euskera indartzen diharduena.

– Elhuyar hiztegia 2006an argitaratu zen, baina 2008az geroztik dago interneten eskuragarri.

– Hiztegi elebiduna da, itzulpenak gazteleratik euskarara edo euskaratik gaztelerara egiten direlarik.

– Paperean ingeles-euskera eta euskera-ingeles hiztegia ere badago.

Adibide moduan hurrengoa jarriko dugu:

Elhuyar

Testu bat itzultzen gaudela beharbada “ezin ikusia” jarri nahi dugu eta ez dakigu gazteleraz hau zelan esaten den edo itzulpenik zehatzena zein den. Beste itzultzaile batzuetara joz gero, “ikusi” jarri eta “ver” azalduko litzateke besterik gabe. Elhuyar hiztegian begiratuz gero aldiz, “ikusi” sartu eta 6 emaitza ematen dizkigu: lehenengo biak aditzak dira zentzu hertsian baina beste bi aditz lokuzioak dira eta azken biak aldiz, esamoldeak. Lehenengo sarreraren barruan, aditz horrek har ditzakeen esanahi ezberdinak agertzen dira (irudian ikus daitekeenez). Lehenik eta behin “ver” esanahia azaltzen da, hau baita erabiliena, eta honen ondoren “opinar, juzgar”; “comprender, darse cuenta” ; “examinar, inspeccionar” ; “visitar, ir a ver”; “soportar, aguantar, padecer, sufrir” eta “tolerar” hurrenez hurren. Esanahi ezberdin bakoitzari adibide bat eskaintzen zaio, zalantzarik egotekotan esanahi zehatz edo erabileraren inguruan zalantza horiek argitu ahal izateko. Ondoren, hurrengo lokuzioak agertzen dira: – ez ikusi/ikusia/ikusiarena egin – ezin ikusi – ikusi arte – ikusteko modukoa izan Hauetariko bakoitzean sakatuz gero, hitz hauen azalpenera eramango gintuzke, eta honek aberastasun itzela ematen digu. Hiztegi zaharragotan, edo beste mota bateko hiztegietan beste barik, ez da horrelako lokuziorik topatzeko aukerarik ematen, hitz baten ordezko ezberdinak ematen dira beste hizkuntzan eta hori da dena. Testuinguru edo “collocation” ezberdinetan ikusteko aukera ematean, itzultzaile eta orokorrean hizkuntza baten erabiltzaile baten lana izugarri errazten da. Aipaturiko arrazoi hauek guztiak direla eta, Elhuyar hiztegia da gure ustetan hiztegirik onena euskera-gaztelera itzulpenak burutzeko, bi noruntzetan (euskeratik gaztelerara eta gazteleratik euskerara) ondo funtzionatzen duelako eta bere erantzunak ez direlako mugatzen ordezko hutsera, baizik eta erabilera ezberdin eta esamolde ezberdin anitz ematen ditu. Gainera, corpusa edo atzizkien bitartez topatzeko aukera ere bere neurrian baloratu beharra dago, izan ere, gu bezalako filologoentzat, berebiziko garrantzia daukate horrelako tresnek.

LOTURAK:

“Nor Gara”. Elhuyar fundazioa (2009). Retrieved 11:14, March 20, 2011 from:  http://www.elhuyar.org/es/Nor-gara

Elhuyar Fundazioa. (2011, Martxoa 3). Wikipedia, Entziklopedia askea. Retrieved 08:23, Martxoa 29, 2011 from: Elhuyar fundazioa

Waliño J., Garcia E.”Euskerak teknologia berrien aurrean daukan erronka”.Soziolinguistika Klusterra 2010. Retrieved 11:18, March 25 2011 from: http://www.soziolinguistika.org/eu/node/1301

Labayru hiztegiaren azterketa

Labayru Ikastegiak euskal kulturaren ondarea berreskuratu eta barriro gizarteratzeko lanean dihardu joan dan 30 urteotan (1977tik). Horretarako hainbat arlo landu izan ditu: ikerketa, irakaskuntza, itzulpengintza, herri-ondarearen bilketa, euskeraren erabileraren normalizazino planak, etnografia.

Hamabi kidek osotutako Artezkaritza, hauxe da Ikastegiko jaurtze sail gorena, hamabietatik bat Artezkaritzaburua da. Ikastegiaren ibilbidea bideratu eta zaintzea, Ikastegiaren egitarauak eta ekintzak onartzea dira bere helburu nagusiak.

Helburu nagusiak Euskal Herriaren kultur balioak garatu eta eguneratzearen alde izango diran zereginai ekin eta zerbitzuak eskintzea da.Bere eginbeharretariko bat euskal kulturaren berarizko balioak aintzat hartu eta euroi aurrera eragitea dala jasoten da. Hain aberatsa eta bakarra dan kultura hau asko prezietan dala erakusteko gogoa gogoratzen da bertan.

 

EZAUGARRIAK ETA ZERBITZUAK

Euskera-gaztelania ereduko hiztegia da. Bertan, bizkaiera eta Batua uztarturik datoz, Bizkaieraren lexikoa finkatzeko lehenengo saio orokorra dugu. Euskaltzaindiaren hiztegi batuaren ildotik osoturik dago eta lexiko batuaren corpusa ugaltzeko ahaleginaz mamindu da. Hitzen sinonimo aukera ezin hobea dakarkigu, Euskera biziaren ondarea eta tradizio idatziaren ekarria bertan islatuta ditugularik. 60.000 sarrera nagusi eta 90.000tik gorako adiera ditu.

DATU- BASEA

Gaur egungo beharrizanak kontuan hartuta, Labayru Hiztegia  teknologia barrietara ekarri dute, erabiltzaileari kontsulta-hiztegi arin eta eroso bat eskaintzeko. Online formato horretan, hiztegiotan batutako hitzak edota esamoduak modu errazean bilatu daitezke; horretaz gain, norberak bere ekarpenak eta iradokizunak ere egin leikez web orrian ipini duten buzoiaren bidez. Hiztegiaren ezaugarririk bereizgarriena dan horri ere eusten dio: Bizkaiera eta Batua uztarturik dakarz.

LIBURUTEGIA

Labayru Ikastegiaren egungo Euskal Biblioteka 1970ean sortu zen. Hasiera bateko asmoa Euskal Herriaren eta euskal kulturaren ganeko produkzio guztia batzea eta sailkatzea izan zan.

Labayru Ikastegiko Euskal Biblioteka aberastasun handiko gunetzat hartzen da euskal bibliografiaren arloan. Hogeta hamazortzi urte igaro dira sortu zenetik, eta ordurik hona beharrerako lagun eta diru-baliabide ugari eskaini zaio. Euskal kulturaren aditu eta ikerlarientzat emoten du aukerarik zabalena; eta horreek guztiak gura dabenean gerturatu daitezke.

 HITZ BILAKETAK

 Hiztegi bi ditugu kontsultarako: Labayru Hiztegia ( euskera-gaztelania) eta Diccionario Labayru (castellano-euskara). Lehenengoa aukeratuz gero, hau ageriko zaigu:

 

  

Labayru Hiztegian zaudela, hutsik dagoen laukian aurkitu nahi duzun hitza idatzi behar da; ez badakizu zehatz zelan idazten den, nahiko izango duzu bertan hasierako silaba bat edota bi idatzita, -(e)tik hasita dalako berez datorren bilaketa-modua. Gero, bilatu botoia sakatu eta badago.

Bilaketa-modu horretaz gainera,  beste bilaketa-modu bi ere baditugu, berbea osorik eta daukala deritxenak. Lehenengoa hautu ezkero, zuzen joango zara tekleatu duzun berbara; bigarrena erabili ezkero,  idatzi duzun silaba hori daukaten berba guztien zerrendak agertuko zaizkizu.

Kontuan euki atzizki, aurrizki, artizki edo konposizio-hizkiren bat bilatu nahi baduzu, aurretik edo atzetik gidoia duelarik egin behar duzula.

 

 

 Zeuk zehaztutako bilaketa-baldintzak betetzen dituen hitzak erakutsiko dizkizu programak. Zerrenda horretako berba bakoitxari sakatu ezkero, horren gaineko azalpen linguistiko osoa eukiko duzu, esanguren arabera atondurik.

Esangura bakotxak bere kategoria gramatikala ekarriko du, adiera-zenbakiaren ostean; behar denean, marka estilistikoaz, zehaztapen tematikoaz eta izen zientifikoaz be hornituta etorriko da, ordena horretan etorririk.

 

 

Esanahi bakotxari dagozkion ordainak azpian pilaturik ikusiko dituzu. Horren atzean, sarrera-hitzari dagokion ohar edo azalpen semantiko zein gramatikalen bat ere irakurriko duzu. Eskumako aldean, hitz nagusiari lotutako lokuzioak edo azpisarrerak ere kontsultagai daude; hauen fitxak ikusi nahi izan ezkero, sakatzea baino ez daukazu. 

Eta azkeneko lerroan, sarrera-hitzaren sinonimorik garrantzitsuenak ageri dira alfabetikoki. 

  • ADIERA ZK. | KAT. GRAM. | MARKA ESTILIST. | ZEHAZT. TEMATIKOA | IZEN ZIENTIFIKOA
  • ORDAINAK
  • OHARRAK
  • SINONIMOAK

Adibideen erabilpena oso aberatza da hiztegi honetan, nabari da egituratzeko orduan erabilitako corpusa oso zabala izan dela. Hona hemen adibide bat:

BIZKAIERA ETA BATUA ( BIALTZE-OHARRAK )

Labayru Hiztegiak euskera baturako onarturik dauden hitzekin batera, bizkaiera idatzirako finkatu diran hitzak ere badakartza. Bizkaiera eta batua erregistroetako hitz baliokideak botoi baten bidez loturik daude hiztegi online honetan.

Konturako, burdi bizkaierazko hitzak gurdi batuzko berbakidera eramango zaitu jasoa botoiari sakatuta; eta beste erara ere bardin-bardin, hau da, gurditik burdira joan zaitezke lotura-botoi hori erabilita.

 

 

ESTEKAK

Labayru Ikastegia / Hiztegia Online http://zerbitzuak.labayru.org/diccionario/hiztegiasarrera.asp

Labayru Hiztegia Online, Bizkaiera eta Batua uztarturik. Bildua: maiatzak 6, 2011. Orrialdea: (pdf formatuan) http://zerbitzuak.labayru.org/diccionario/laguntza.pdf

Diccionario completo Labayru online. KULTURKLIK (euskadi.net). Bildua: maiatzak 6, 2011. Orrialdea: http://www.kulturklik.euskadi.net/lang/es/labayru-hiztegia-online-osatuta-diccionario-labayru-completo-online/

Bizkaiera ardatz duen hiztegia. Azpeitiko euskara patronatua (erabili.com). Bildua: maiatzak 6, 2011. Orrialdea: http://www.erabili.com/zer_berri/berriak/1148996185

Labayru hiztegiaren aurkezpena (slidesharen) (2011/05/03). WordPress. Bildua: maiatzak 6, 2011. Orrialdea: http://1ekarrie.wordpress.com/2011/05/03/labayru-hiztegiaren-aurkezpena-slideshare/

YourDictionary

 On the following lines, it is going to be described one free on-line english dictionary called Yourdictionary. This dictionary can be visited on the website http://www.yourdictionary.com/. As it has already been said, it is an english dictionary that translate the words from english to english, in other words, monolingual. That is why this book is particularly useful for those persons who are english native speakers or that have already a high level of English. However, many people do not only need only english dictionaries and thanks to this web they can find dictionaries for a lot of different languages, Yourdictionary is also a language portal with more than 2,500 different dictionaries. Moreover, Users can also find grammars in over 300 languages. It has to be said that this incredible site is owned by LoveToKnow Corporation which is a company that also includes sites such as PublicBookshelf.com, Adviceopedia.org and FlexJobs.com.

But why is YourDictionary different from others dictionaries like Wordreference? There are several reasons. For instance, one aspect that makes it special is that it has many resources such as the Webster’s New World Dictionary, the American Heritage Dictionary or the Computer Desktop Encyclopedia. Furthermore, some of its resources are taken from wordbooks which are specialized in a certain domain or field. For example, there are some words from the field of law that do not appear in a regular lexicon, but with Yourdictionary the user can find these words thanks to the Webster’s New World Law Dictionary.

Another advantage is the possibility to use  Thesaurus which consists on a reference work that groups together different types of words that have similarity in meaning or that are connected. For example, imagine that you are looking for the word ball, you will find (apart from the definition) words like globe, balloon, baseball… This wordbook has more options than Thesaurus like sentence examples, acronyms, images, idioms, quote examples…You can see in the next image how Thesaurus works.

Moreover, the fact of being able to look up words that we do not know how they are spelled also makes a distinction between the other dictionaries.  Take as an example the word receive. Imagine that you do not know how it is spelled between the letter c to the letter v. The only thing you have to do is to write two question marks where you do not know how it is spelled. E.g : re c??ve( or an asterisk if yo do not really know the number of unknown letters)Finally, the dictionary also includes games for improving our language skills (crosswords, word definition games, anagram puzzles…) and forums to speak about languages or words.

In conclusion, it could be said that the dictionaries of this century are changing the concept of what we understand by dictionary.  We can look up words free, faster, have in the same portal grammars and dictionaries, games for improving our knowledge of the language,forums… Nowadays, there are not excuses for learning new languages. There are magnificent tools available for those ones willing to increase their knowledge of the world!

 

References:

OROTARIKO EUSKAL HIZTEGIA (taldeko lana)

Egileak: Irati Garaioa, Idoia Ibarluzea eta Amaia Navarro

Sarrera

Orotariko Euskal Hiztegia (OEH siglez ere ezaguna) Euskaltzaindiak egin duen lanik handienetako bat da,  lexikografian ari direnentzako ezinbesteko baliabidea izanik. Hiztegi historiko honetan euskararen aro eta euskalki guztietako idazkietako lexikoa jaso eta antolatzen da. Orotariko Euskal Hiztegia hamasei liburukitan argitaratuta dago: lehena 1987an argitaratu zen paperean eta  16.a 2005ean. Ikertzaile eta erabiltzaile orok erraztasunez kontsulta dezan Euskaltzaindiak Internetez eskaintzen du hiztegiaren oinarrizko bertsio elektronikoa, orrialde honetan eskuragarri dagoena: http://www.euskaltzaindia.net/oeh

 

Babeslea eta bultzatzailea

Aztertzen ari garen hiztegi hau Euskaltzaindiak bultzatua da. Koldo Mitxelenak, Euskaltzaindiaren enkarguari jarraituz, eman zion hasiera ekimen honi 1984. urtean euskararen ondare lexikografiko zabala biltzeko helburuz. Hasiera batean, lan hau burutzeko 50 urte lehenago (1955ean) Azkuek argitaratu zuen Diccionario Vasco-Español-Francés obra eguneratu, zuzendu eta osatzen hasi zen. Dena den, lehen saiakera honek ez zuen atarramendurik  eman, alde batetik lana oso astiro zihoalako eta, bestetik, La Gran Enciclopedia Vasca argitaletxeak Azkueren hiztegia berrargitaratu zuelako. Beraz, ekimen hau aurrera ateratzeko beste irtenbide bat aurkitu beharrean zeuden eta Mitxelena ohartu zen hiztegia osatzeko lan-talde zabala beharrezkoa zela, lan mardulagoa egitea ezinbestekoa baitzen. Mitxelenaren  heriotzaren ondoren (1987an) Ibon Sarasolak hartu zuen ekimen honekin jarraitzeko ardura.

Gainera, web orrialdean agertzen diren dokumentu, zerrenda eta datu-baseak  Creative Commons Aitortu-EzKomertziala-PartekatuBerdin baimen baten mende daude. Creative Commons  sormenezko lanak partekatzeko traba legalak murriztea helburu duen erakundea da, 2001ean sortua.


Irudi horien bidez adierazten dena zera da: dokumentu hauekin egin daitekeena edo ezin egin daitekeena. Hauek dira esanahiak:

Aintzat hartzea: material hauek banatu, kopiatu eta erakus daitezke.

Ez-komertziala: material hauek banatu, kopiatu eta erakus daitezke erabilera komertziala ez den bitartean.

Share alike: guk sortutako materiala alda eta bana daiteke baina beti ere material originalaren lizentzia pean.

 

Corpusa

Hiztegiaren corpusa osatzeko 1970eko hamarkada arterainoko 310 obra oso aukeratu zituzten. Hortik, 5.800.000 hitz atera zituzten. Idazki horietatik kanpo dagoen lexikoa ez da Orotarikoan azaltzen.

 

Erabilitako hizkuntzak

Esan bezala, euskarazko hiztegi bat da; hitz-sarrerak eta adibideak euskaraz azaltzen dira, baina azalpenak gaztelaniaz edo frantsesez ematen dira, eta kasu askotan bi hizkuntzetan. Hala ere, ezin dezakegu esan hiztegi hau guztiz elebiduna denik, euskal hitzen gaztelaniazko eta batzuetan frantsesezko ordainak ematen badira ere, ez baitira alderantziz ematen.

 

Hitz-sarreren egitura

Orotariko Euskal Hiztegiak 125.987 sarrera biltzen ditu eta honela egituratzen dira:

  1. Hitza.
  2. Hitzaren aldaerak eta aurreko hiztegigileek hitzari buruz esandakoa.
  3. Aldaera bakoitzaren euskalkiak.
  4. Aldaeraren idatzizko lehen erabileraren urtea (gehienetan).
  5. Hitzaren esanahia.
  6. Literatur tradizioko adibideren batzuk.

Adibide hauekin argiago ikusiko dugu OEHaren hitz-sarreren egitura: Eguzki izena:

Adibidean ikus dezakegunez, lehenengo eta behin hitz hau zein euskalkitan erabiltzen den azaltzen da: bizkaiera (V), gipuzkera (G), goi-nafarrera (AN), lapurtera (L), Donamartiriko behe-nafarrera (BN-arb) eta erronkariera (R). Ondoren hitz hau zein autorek erabili duten azaltzen da: LANDUCHIUS (Lcc), ECHAVE (Ech), MICOLETA (Mic), DEEN (Deen), URTE (Urt), LARRAMENDI (Lar), AÑIBARRO (Añ), DUVOISIN (Dv) eta HARRIET (H). Autoreen ostean eguzki hitzaren aldaerak agertzen dira, besteak beste: egoski, egozki, eguski, eguzku, euski, euzki, iduzki, iguski, iguzki, iluzki, iruzki, iuzki. Azkenik zenbait erreferentzia bibliografiko daude.

Azalpen hauen ondoren hitzaren esanahia azaltzen da eta hiztegi honetan, gorago esan dugun bezala, gaztelaniazko ordainaren bidez egiten da. OEHn eguzki izenak hiru esangura ditu. Hainbat adibide ematen dira  (hauetako batzuk frantsesez daude) eta zein liburutan agertzen diren ere aipatuta dago.

Orotariko Euskal Hiztegiak azpi-sarrerak (bai eguzki hitzarekin konposatuak bai eratorriak) ere eskaintzen ditu eta kasu honetan anitzak dira. Hitz-sarrera nagusiaren azpian agertzen dira zerrenda batean eta hauetariko batean klikatuz hitz horren sarrerara joan gaitezke. Esaterako, eguzki-lili, eguzki-ospel, eguzki-sortze; eguzkialdi, eguzkipeko, eguzkiratu, eta abar.

Lotsati izenondoa:

Adibidean ikus dezakegunez, lehenengo eta behin izenondo hau zein euskalkitan erabiltzen den azaltzen da: bizkaiera (V) eta gipuzkera (G). Gero, zein autoreek erabili duten: LARRAMENDI (Lar) eta AÑIBARRO (Añ). Ondoren, berriro agertzen dira lehenago aipatutako euskalkiak; eta honen ostean, autoreak agertzen dira berriz: IZTUETA (Izt), MOGUEL (Mg) eta DUVOISIN (Dv). Autoreen aipamena egin ostean, berriro aipatzen dira aurreko bi euskalkiak (V, G); hots; bizkaiera eta gipuzkera. Amaitzeko, azken autore bat aipatzen da: HARRIET(H).

Autoreen ostean lotsati izenondoaren aldaera bakarra agertzen da: Lotzati. Aldaera hau zein euskalkitan agertu den azaltzen da jarraian: Bergara eta Salinas-eko aldaeretan (V-gip). Honen ostean, aldaera hau erabili duten autoreak aipatzen dira: AZKUE (A), IZAGUIRRE (Iz), ETXEBARRIA (Etxba) eta ELEXPURU (Elexp).

Azalpen hauen ondoren hitzaren esanahia azaltzen da . Aztergai dugun hiztegi honetan lotsati izenondoak hiru esangura ditu. Hainbat adibide ematen dira adiera bakoitzean, eta zein liburutan agertzen diren aipatzen da ere.

Orotariko Euskal Hiztegiak izenondo honekiko lotura duen azpi-sarrera bakarra eskaintzen digu: lotsatiro.

Ikusi aditza:

Lehenengo eta behin ikusi forma orokorra (gral) zein autorek erabili duten azaltzen da: VOLTOIRE (Volt), POUVREAU (SP), LARRAMENDI (Lar), AÑIBARRO (Añ), DUVOISIN (Dv), HARRIET (H), DEEN (Deen), URTE (Urt), HARRIET, Martin (Ht) eta ARCHU (Arch). Ondoren, ikusi aditzaren aldaerak agertzen dira eta honekin batera, zein euskalkitan erabiltzen diren eta zein autorek erabili dituzten: ekusi Orozkoko bizkaiera (V-oroz), gipuzkera (G), Gipuzkoako, Larrauneko eta Arakilgo goi-nafarrera (AN-gip-larr-araq); ekosi Orozkoko bizkaiera (V-oroz); kusi Ulzamako, Erroko eta Gulinako goi-nafarrera (AN-ulz-erro-gulina), baztanera (B), Cizeko eta Baigorriko baztanera (BN-ciz-baig) eta ukusi Gernikako eta Bermeoko bizkaiera (V-ger) eta Burunda eta Etxarri-Aranazko gipuzkera aldaera (G-nav). Azkenik, beste bi adibideetan bezala, zenbait erreferentzia bibliografiko daude.

Azalpen hauen ondoren hitzaren esanahia da agertzen dena. Lehenengo eta behin, tradizio literarioa (tr) azaltzen da eta jarrian Ikusi hitzak dituen sarrerak: lau sarrera ditu aditz moduan, eta beste lau izentzat hartzen badugu.

Azkeneko adibide honetan ere azpi-sarrerak azaltzen zaizkigu. Hala nola, ikusiarena egin, ikusi arte, ikustera utzi, ikusiezin, ikusmin, ikusizale, ikusi-makusi, eta abar.

Laburdurak bi ataletan banatzen dira: lehenengoan, orokorrak ditugu. Adibidez:

Ikus daitekeenez, mota guztietako laburdurak biltzen dira atal honetan. Alde batetik, hitz-kategoriei dagozkienak dauzkagu, hala nola adj (izenondoa), sust (sustantiboa), vb (aditza) eta abar. Beste alde batetik, hizkuntza desberdinen laburdurak dauzkagu, esaterako: esp (espainiera), fr (frantsesa), cat (katalana), gal (galesa), vasc (euskara), irl (irlandesa) port (portugesa), eta abar. Gainera, morfosintaxiarekin zerikusia duten zenbait hitzen laburdurak ere badaude: art (artikuloa), decl (deklinabidea), erg (ergatiboa), gen (genitiboa), conj (konjunzioa), intrans (intrantsitiboa), eta abar. Azkenik, bestelako laburdura batzuk ere azaltzen dira atal honetan, besteak beste, ant (antzinakoa), arc (arkaikoa), euf (eufemismoa), gral (orokorra), litm (literalki), princ (hasiera), tit (izenburua), eta abar.

Bigarrenean, euskalki, azpieuskalki eta aldaerak agertzen dira. Esaterako:

Multzo desberdinak egin daitezke bigarren atal honetan ere: alde batetik, euskalkiak azaltzen dira: V (bizkaiera), G (gipuzkera), AN (goi-nafarrera), L (lapurtera), B (baztanera), BN (behe-nafarrera), S (zuberera) eta R (erronakariera). Bestetik, euskalki bakoitzaren azpieuskalki eta aldaerak ere agertzen dira. Bizkaieraren kasuan: V-ger (Gernika eta Bermeo aldeko aldaera), V-gip (Bergara aldekoa), V-al (Araba aldekoa), eta abar. Gipuzkeraren kasuan: G-azp (Azpeitia aldeko aldaera), G-bet (Beterrikoa), G-nav (Nafarroa aldekoa), eta abar. Goi-nafarrerari dagokionez: AN-gip (Gipuzkoa aldeko aldaera), AN-larr (Larraunekoa), AN-ulz (Ultzamakoa), eta abar. Lapurteraren kasuan: L-côte (Donibane Lohizuneko aldaera), L-sar (Sarakoa), L-ain (Ainhoakoa), eta abar. Behe-nafarrerari dagokionez: BN-or (ekialdeko aldaera), BN-baig (Baigorrikoa), BN-lab (Lapurdikoa), eta abar. Zubereraren kasuan bi azpieuskalki azaltzen dira: S-no (ipar-ekialdekoa) eta S-bas (Basaburukoa). Azkenik, erronkarierari dagokionez: R-is (Isabako aldaera), R-uzt (Uztarrozekoa), R-urz (Urzainkikoa), eta abar. Baztaneraren kasuan ez da azpieuskalki edo aldaerarik azaltzen.

 

Bibliografia

Hauek dira Interneten Orotariko Euskal Hiztegiari buruz idatzitako zenbait artikulu eta lan: