Orri honetan: Aurkezpena / Deskargatu / Iturburu-kodea / Lizentzia / Nola egin aipamena / Plataforma eta betekizunak / Instalazioa / Nola erabili / Kontaktua

ixa-pipe-pos-eu

ixa-pipe-pos-eu analizatzaile morfosintaktiko eta etiketatzaile sendo eta estaldura zabalekoa da, Eustagger euskararako lematizatzaile/etiketatzailearen bertsio egokitua. C++ programazio lengoaian inplementatua dago.

Prozesamendu linguistikoko katearen lehenengo modulua da. Tresna honek testu gordina hartzen du sarrera moduan, eta irteeran token bakoitzarentzat lema, kategoria eta informazio morfologikoa idazten ditu NAF formatuan dagoen dokumentu batean.

Deskargatu

Azken bertsio egonkorrari dagokion aurrekonpilatutako pakete bitarra ondorengo esteka hauetatik deskarga dezakezu:

Iturburu-kodea

Garapeneko azken bertsioaren iturburu-kodea Github Eustagger Lite orrian aurkituko duzu.

Lizentzia

ixa-pipe-pos-eu-rako sortu den jatorrizko kode guztia GPL v3 lizentzia librera atxikiturik dago.

Software honek kanpoko liburutegiak erabiltzen ditu, eta hauek beren lizentzia eta copyright jabeak dituzte:

Nola egin aipamena

ixa-pipe-pos-eu tresna erabiltzen baduzu, ondorengo lan honen aipamena egin zure lan akademikoan mesedez:

Arantxa Otegi, Nerea Ezeiza, Iakes Goenaga and Gorka Labaka. A Modular Chain of NLP Tools for Basque. In Proceedings of the 19th International Conference on Text, Speech and Dialogue - TSD 2016, Brno, Czech Republic, volume 9924 of Lecture Notes in Artificial Intelligence, pp. 93-100. 2016
[bibtex]

Plataforma eta betekizunak

Erabiltzeko prest dauden paketeak Linuxerako bakarrik daude eskuragarri.

Beste makina batzuetan erabiltzeko, iturburu-kodea deskargatu eta konpila daiteke. Dependentzia batzuk dituenez, aurretik liburutegi eta programa gehigarri batzuk instalatu beharra daude. Horretarako, IRAKURRI fitxategiko argibideak jarraitu.

Instalazioa

Pakete bitar aurrekonpilatua deskargatu ondoren, fitxategia deskonprimitu eta exekutagarria erabiltzeko prest egongo da, inongo instalaziorik egin gabe.

Iturburu-kodea konpilatu nahi baduzu, jarraitu IRAKURRI fitxategiko argibideak.

Nola erabili

ixa-pipe-pos-eu.sh exekutagarria erabili behar da ixa-pipe-pos-eu tresna exekutatzeko. Ez dauka argumenturik.

Tresna honek sarrera estandarretik irakurtzen du, eta sarrera horrek UTF-8an kodetuta dagoen testu planoa izan behar du. Hortaz, testu gordina duen fitxategi bateko lemak, kategoriak eta informazio morfologikoa lortzeko, honako komando hau erabil dezakezu:
> cat test.txt | sh ixa-pipe-pos-eu/ixa-pipe-pos-eu.sh

Tresnak irteera estandarrean idatziko du, UTF-8an kodetutatako NAF formatuan. Irteerako NAF dokumentuan text eta terms elementuen bidez hainbat informazio linguistiko markatuta ageriko dira beheko adibide honetan ikus daitekeen moduan (adibideko sarrerako esaldia honakoa da: "Donostiako Zinemaldiko sail ofizialean lehiatuko da Handia filma."):
<text>
   <wf id="w1" offset="0" length="10" sent="1" para="1">Donostiako</wf>
   <wf id="w2" offset="11" length="11" sent="1" para="1">Zinemaldiko</wf>
   <wf id="w3" offset="23" length="4" sent="1" para="1">sail</wf>
   <wf id="w4" offset="28" length="10" sent="1" para="1">ofizialean</wf>
   <wf id="w5" offset="39" length="9" sent="1" para="1">lehiatuko</wf>
   <wf id="w6" offset="49" length="2" sent="1" para="1">da</wf>
   <wf id="w7" offset="52" length="6" sent="1" para="1">Handia</wf>
   <wf id="w8" offset="59" length="5" sent="1" para="1">filma</wf>
   <wf id="w9" offset="64" length="1" sent="1" para="1">.</wf>
</text>
<terms>
   <!-- Donostiako -->
   <term id="t1" lemma="Donostia" morphofeat="NL0LS000" pos="R" case="IZE LIB PLU- GEL NUMS MUGM ZERO HAS_MAI @<IZLG @IZLG>">
     <span>
       <target id="w1"/>
     </span>
   </term>
   <!-- Zinemaldiko -->
   <term id="t2" lemma="zinemaldi" morphofeat="NC0LS000" pos="N" case="IZE ARR GEL NUMS MUGM ZERO HAS_MAI @<IZLG @IZLG>">
     <span>
       <target id="w2"/>
     </span>
   </term>
   <!-- sail -->
   <term id="t3" lemma="sail" morphofeat="NC000000" pos="N" case="IZE ARR BIZ- ZERO @KM>">
     <span>
       <target id="w3"/>
     </span>
   </term>
  ...
</terms>

Kontaktua

Arantxa Otegi, arantza.otegi@ehu.eus
Nerea Ezeiza, n.ezeiza@ehu.eus