Clarin-k center IXA taldea
EU EN ES

ANALHITZA te ayudará a extraer de un texto en euskara, español o inglés la siguiente información lingüística:

  • nombres, adjetivos, verbos, adverbios...
  • nombres de personas, nombres de lugares...
  • secuencias de dos, tres y cuatro palabras
  • ... y mucho más!

El texto a analizar puede ser el que tengas en un fichero, algo que copiarás aquí, o de una página web, pero tendrá que estar codificado en UTF8. Para utilizar ANALHITZA, introduce el texto a analizar siguiendo una de las 3 opciones de aquí abajo, y a continuación, elige el idioma del texto (euskara, español o inglés). Después de esperar un momento, recibirás los resultados en un fichero Excel. Así, podrás adaptar fácilmente los resultados a tus necesidades.



Resultado

Archivos analizados :
Archivo de entradaCreadoArchivo de salida
  ako_jirxutxt February 10 2017 14:07:53    probatarako_jirxuxen    
  txt February 10 2017 12:55:22    probatarako    

 
ANALHITZA procesa automáticamente el texto utilizando ixaKat (para el euskara) e IXA pipes (para el español e inglés), que son cadenas modulares de procesadores lingüísticos.
ANALHITZA, haciendo uso de las tecnologías del lenguaje, ha sido diseñado para que los investigadores de las humanidades y ciencias sociales puedan obtener análisis lingüísticos fiables y fácilmente manipulables. Si tienes definido un tema de investigación en alguno de estos campos, si dispones de un corpus y si estás interesado en utilizar ANALHITZA, escríbenos y te podremos asesorar: mikel.iruskieta@ehu.eus
 Si utilizas ANALHITZA, cita el siguiente artículo en tu trabajo académico por favor:
Otegi, A. Imaz, O. Díaz de Ilarraza, A. Iruskieta, M. Uria, L. 2017 ANALHITZA: a tool to extract linguistic information from large corpora in Humanities research. Procesamiento del Lenguaje Natural 58: 77-84.













 

Grupo IXA
M. Lardizabal Pasealekua 1
20080 Donostia
(País Vasco)

Email: ixa@ehu.eus
Website: ixa.eus