English version
Versión en galego

Etiquetador semántico multilingüe automático y sostenible

ESMAS-ES+

ESMAS-ES+ es un proyecto financiado por el Ministerio de Ciencia e Innovación/Agencia Estatal de Investigación/FEDER “Una manera de hacer Europa” (Proyecto PID2022-137170OB-I00). 

El principal objetivo de este proyecto consiste en desarrollar y verificar un método combinado para el diseño de un prototipo de etiquetador semántico, multilingüe, automático y sostenible, para alemán, español, francés y gallego. Nuestra propuesta integra aspectos léxicos que van desde la lexicografía y la semántica léxica computacional hasta las tecnologías para el análisis del léxico y la representación formal del significado, así como su explotación en aplicaciones informáticas.

Nuestro  etiquetador semántico, automático y sostenible requiere un método combinado multimodular, que permita describir y codificar automáticamente la complejidad de los sistemas lingüísticos, en especial, la información semántica. Partimos de la hipótesis de que es posible desarrollar este etiquetador semántico-categorial siguiendo un método que conjugue:

  • a) semántica combinatoria, ontologías y bases de datos léxicas;      
  • b) técnicas y estrategias del lenguaje natural (PLN; recuperación y extracción de información, modelos neuronales y métodos predictivos);
  • c) técnicas estadísticas, y
  • d) herramientas diseñadas para la generación automática del lenguaje (GLN) y la traducción automática del caudal léxico.

Con dicho método se abre la puerta al diseño de un recurso para la anotación semántica y explotación automática de grandes corpus en diferentes lenguas —esto es, un mismo método y técnicas semejantes para diferentes sistemas lingüísticos—.

Elementos clave en este proyecto son la interoperabilidad, la integrabilidad, la sostenibilidad, la circularidad de la economía lingüística y tecnológica, así como el multilingüismo.

 

Proyecto ESMAS-ES+ (PID2022-137170OB-I00) financiado por MCIN/AEI//FEDER “Una manera de hacer Europa”.