ixa-pipe-pos-eu

ixa-pipe-pos-eu analizatzaile morfosintaktiko eta etiketatzaile sendo eta estaldura zabalekoa da, Eustagger euskararako lematizatzaile/etiketatzailearen bertsio egokitua.

Prozesamendu linguistikoko katearen lehenengo modulua da. Tresna honekk testu gordina hartzen du sarrera moduan, eta irteeran token bakoitzarentzat lema, kategoria eta informazio morfologikoa idazten ditu NAF formatuan.

Deskargatu

Azken bertsio egonkorrari dagokion aurrekonpilatutako pakete bitarra ondorengo esteka hauetatik deskarga dezakezu:

Iturburu-kodea

Garapeneko azken bertsioaren iturburu-kodea Github Eustagger Lite orritik deskargatu edo klona daiteke.

Lizentzia

ixa-pipe-pos-eu-rako sortu den jatorrizko kode guztia GPL v3 lizentzia librera atxikiturik dago.

Software honek kanpoko liburutegiak erabiltzen ditu, eta hauek beren lizentzia eta copyright jabeak dituzte:

Nola egin aipamena

ixa-pipe-pos-eu tresna erabiltzen baduzu, ondorengo lan honen aipamena egin zure lan akademikoan mesedez:

Arantxa Otegi, Nerea Ezeiza, Iakes Goenaga and Gorka Labaka. A Modular Chain of NLP Tools for Basque. In Proceedings of the 19th International Conference on Text, Speech and Dialogue - TSD 2016, Brno, Czech Republic, volume 9924 of Lecture Notes in Artificial Intelligence, pp. 93-100. 2016
[bibtex]

Plataforma eta betekizunak

Erabiltzeko prest dauden paketeak Linuxerako bakarrik daude eskuragarri.

Beste makina batzuetan erabiltzeko, iturburu-kodea deskargatu eta konpila daiteke. Dependentzia batzuk dituenez, aurretik liburutegi eta programa gehigarri batzuk instalatu beharra daude. Horretarako, IRAKURRI fitxategiko argibideak jarraitu.

Instalazioa

Pakete bitar aurrekonpilatua deskargatu ondoren, fitxategia deskonprimitu eta exekutagarria erabiltzeko prest egongo da, inongo instalaziorik egin gabe.

Iturburu-kodea konpilatu nahi baduzu, jarraitu IRAKURRI fitxategiko argibideak.

Nola erabili

ixa-pipe-pos-eu.sh exekutagarria erabili behar da tresna exekutatzeko. Sarrera estandarretik irakurriko du, eta sarrera horrek UTF-8an kodetuta dagoen testu planoa izan behar du. Irteera estandarrean idatziko du, UTF-8an kodetutatako NAF formatuan.

Kontaktua

Arantxa Otegi, arantza.otegi@ehu.eus
Nerea Ezeiza, n.ezeiza@ehu.eus