ixaKat

...Euskal Herriko Unibertsitateko IXA taldean garatzen ari den hizkuntza prozesatzaileen kate modularra da, euskararen tratamendu automatikorako balio duena.

Tresnak

Euskararen tratamendurako balio duen hizkuntza prozesatzaileen kate modular honen ezaugarri nagusiena honakoa da: lehenengo tresnak analisi morfosintaktiko sakona burutzen du, eta morfologikoki aberatsak diren anotazio hauek erabiltzen dituzte katean atzetik datozen prozesatzaile linguistikoek.

Katearen inplementazioa diseinu modularrean oinarritzen da, eta prozesatzaileak erabilerrazak dira. Ikusi ezaugarri guztien zerrenda behean.

Tresnak eskuragarri daude, eta erabiltzeko prest gainera. Katea modularra denez, tresnek ez dute orden zurruna jarraitzen, baina tresnen arteko dependentziak kontuan hartu behar dira. Tresna bakoitzaren orrian aurkituko dituzu horietako bakoitza exekutatzeko kontuan izan beharrekoak, baita dependentziak ere. Argibide horiek jarraitu arren arazoak baldin badituzu, tresna bakoitzaren deskribapen orrian aurkituko dituzu kontakturako aukerak. Edo bestela, foroan galdetu.

ixaKat zure ikerketan erabiltzen baduzu, gure lanaren aipamena egin hemen azaltzen dugun moduan mesedez.

Momentuz katea lau tresnek osatzen dute, baina ari gara beste tresna batzuk ere moldatzen eta prestatzen. Pixkanaka goaz katea osatzen, eta laster egongo dira erabilgarri tresna gehiago. ixaKat katearekin lortzen den prozesamendu linguistikoa IXA pipes tresnekin osatu daiteke. Izan ere, IXA pipes hizkuntzaren prozesamendurako hainbat tresna eleaniztunen sorta bat da, eta baditu hainbat tresna euskararen prozesamendurako. ixaKat eta IXA pipes kateak modularrak direnez, eta biek NAF formatua erabiltzen dutenez sarrera/irteera formatu moduan, bi multzotako tresnak kateatu daitezke prozesamendu-kate berean.

Ezaugarriak

Katea modularra denez, tresnak hartu eta aldatu daitezke, beti ere, derrigorrezko datu formatua erabiltzen badute sarrera eta irteera estandarrean. Prozesatzaileek Unixeko pipeline-en portaera dute, denek sarrera estandarretik irakurri, dagokien analisi linguistikoa egin, eta irteera estandarrean idazten dute hurrengoari pasaz informazioa.

NAF formatua erabiltzen da anotazio linguistikoak adierazi eta tresnen artean elkartrukatzeko. NAF anotazio linguistikoetarako formatua hizkuntzaren prozesamenduko pipe-line konplexuetarako diseinatu zen. Tresna guztien sarrera eta irteera formatua NAF izango da, aurrenekoarena (ixa-pipe-pos-eu) izan ezik, honek testu gordina jasotzen baitu.

Morfologikoki aberatsak diren anotazioen transmisioa tresnen artean.

Tresna guztiek UTF-8 karaktere-kodeketa darabilte.

Edozeinentzat eskuragarri daude tresnak (fitxategi exekutagarriak).

GPL v3 software libreko lizentziarekin banatuak.

Katearekin esaldi bakar bat, paragrafo bat edo dokumentu oso bat anotatu daiteke.

Katearen sendotasuna probatu da prozesaketa handi batekin.

Tresnak erabiltzen hasi aurretiko instalazio- edo prestaketa-esfortzu urria.

Komando-lerroko interfaze sinple bat erabiliz, katea exekutatzea erraza da.