Orri honetan: Aurkezpena / Deskargatu / Iturburu-kodea / Lizentzia / Nola egin aipamena / Instalazioa / Nola erabili / Kontaktua

ixa-pipe-srl-eu

ixa-pipe-srl-eu euskaraz idatzitako testuetarako rol semantikoen etiketatzailea da. Ikasketa automatikoan oinarritzen da eta Perl programazio lengoaian inplementatua dago.

Tresna honek NAF formatuan dagoen dokumentu bat hartzen du sarrera moduan. Sarrerako dokumentu horrek lemak, kategoriak, informazio morfologikoa eta dependentzia etiketak izan behar ditu. Sarreran beharreko informazio linguistiko hori duen NAF dokumentua ondorengo ixaKat tresnek osatzen duten analisi katearen irteeran lortzen da:
     ixa-pipe-pos-eu | ixa-pipe-dep-eu

Deskargatu

Azken bertsio egonkorrari dagokion exekutagarria duen paketea ondorengo esteka honetatik deskarga dezakezu:
ixa-pipe-srl-eu-v1.0.0.tgz

Baliabide linguistikoak

Tresna honek hainbat baliabide linguistiko behar ditu eta horiek ondorengo esteka honetatik deskarga ditzakezu:
srl-eu-resources-v1.0.0.tgz

Iturburu-kodea

Garapeneko azken bertsioaren iturburu-kodea Githubeko orri honetan aurkituko duzu.

Lizentzia

ixa-pipe-srl-eu-rako sortu den jatorrizko kode guztia GPL v3 lizentzia librera atxikiturik dago.

Software honek kanpoko baliabide bat erabiltzen du, eta kodearekin batera banatzen dugu. Baliabide honek bere lizentzia du: Horretaz gain, tresna honek beste hainbat kanpoko tresna erabiltzen ditu, baina hauen lizentzia dela eta, ez ditugu banatzen (erabiltzaileak lortu eta instalatu beharko ditu instalazioa atalean adierazitako moduan). Hauexek dira tresna horiek eta horien copyright jabeak eta lizentziak:

Nola egin aipamena

ixa-pipe-srl-eu tresna erabiltzen baduzu, ondorengo lan honen aipamena egin zure lan akademikoan mesedez:

Haritz Salaberri, Olatz Arregi, Beņat Zapirain. bRol: The parser of Syntactic and Semantic Dependencies for Basque. In Proceedings of Recent Advances in Natural Language Processing (RANLP-2015), Hissar, Bulgaria, pp. 555-562. 2015.
[bibtex]

Instalazioa

Fitxategi exekutagarria duen paketea deskargatu ondoren, paketea deskonprimitu beharko duzu. Ondoren, tresna erabiltzen hasi aurretik, honako urrats hauek jarraitu beharko dituzu beharrezko baliabide eta dependentziak instalatzeko:

Honetaz gain, Perl (eta honen liburutegi batzuk) instalatuak eduki beharko dituzu zure makinan.

Nola erabili

nagusia.pl script-a erabili behar da ixa-pipe-srl-eu tresna exekutatzeko. nagusia.pl komandoaren sintaxi osoa honakoa da:

> perl nagusia.pl -d DIR -i ID -l SVM_LIGHT_EXEKUTAGARRIA -m SVM_MULTICLASS_EXEKUTAGARRIA -o MEGAM_OPT_EXEKUTAGARRIA

argumentuak:
   -d DIR     [Beharrezkoa] Zehaztu exekutagarri hau dagoen direktorioaren kokapena.
   -i ID     [Beharrezkoa] Errepikatuko ez den identifikadore zenbaki bat.
   -l SVM_LIGHT_EXEKUTAGARRIA     [Beharrezkoa] Zehaztu SVM ligth exekutagarriaren kokapena.
   -m SVM_MULTICLASS_EXEKUTAGARRIA     [Beharrezkoa] Zehaztu SVM multiclass exekutagarriaren kokapena.
   -o MEGAM_OPT_EXEKUTAGARRIA     [Beharrezkoa] Zehaztu Megam model optimization exekutagarriaren kokapena.

run.sh script exekutagarria eskuragarri jarri da ixa-pipe-srl-eu tresna exekutatu ahal izateko (script honek nagusia.pl script-ari deitzen dio goian azaldutako beharrezko argumentu guztiekin). Erabil dezakezu, baina exekutatu aurretik eguneratu rootDir, svmLightExec, svmMulticlassExec eta megamOptExec aldagaiak instalazioa atalean adierazitako moduan.

Tresna honek sarrera estandarretik irakurtzen du, eta sarrera horrek UTF-8an kodetutako NAF formatuan dagoen dokumentua izan behar du, lemak, kategoriak, informazio morfologikoa eta dependentzia etiketak dituena (NAF-eko text, terms eta deps elementuak). Sarreran beharreko informazio linguistiko hori duen NAF dokumentua ondorengo ixaKat tresnek osatzen duten analisi katearen irteeran lortzen da:

     ixa-pipe-pos-eu | ixa-pipe-dep-eu

Hortaz, testu gordina duen fitxategi bateko rol semantikoak lortzeko, honako komando hau erabil dezakezu (dena komando-lerro bakarrean):
> cat test.txt | sh ixa-pipe-pos-eu/ixa-pipe-pos-eu.sh | sh ixa-pipe-dep-eu/run.sh | sh ixa-pipe-srl-eu/run.sh

Tresnak irteera estandarrean idatziko du, UTF-8an kodetutatako NAF formatuan. Irteerako NAF dokumentuan srl elementuen bidez rol semantikoak markatuta ageriko dira beheko adibide honetan ikus daitekeen moduan (adibideko sarrerako esaldia honakoa da: "Donostiako Zinemaldiko sail ofizialean lehiatuko da Handia filma."):
<srl>
  <predicate id="pr1">
     <!--lehiatuko(compete.01)-->
     <span>
        <target id="t5"/>
     </span>
     <role id="rl1" semRole="ARG2">
        <!--sail-->
       <span>
         <target id="t3"/>
       </span>
      </role>
   </predicate>
  ...
</srl>

Kontaktua

Arantxa Otegi, arantza.otegi@ehu.eus