ESMAS-ES+ en Pontevedra!

O pasado 31 de xaneiro de 2025, o Campus de Pontevedra da Universidade de Vigo acolleu un novo encontro do proxecto ESMAS-ES+ (PID2022-137170OB-I00), organizado por Carlos Valcárcel. Ao longo da xornada, o equipo encargado dos aspectos estatístico-computacionais analizou diferentes estratexias para optimizar a anotación semántica automática en corpora lingüísticos, garantindo a súa sostibilidade.

A sesión contou coa participación de José João Almeida (Universidade do Minho) e José Ramom Pichel (CITIUS) como consultores externos, que achegaron contribucións chave para a validación metodolóxica e a extracción de datos lingüísticos desde unha perspectiva computacional. Desde aquí, obrigado!

Durante o encontro, avanzouse na optimización das ferramentas de anotación multilingüe, explorando a integración de modelos como BERT e grandes modelos de lingua (LLM). Ademais, deseñouse un plan de probas metodolóxicas para avaliar a calidade das anotacións e perfeccionar os criterios de etiquetaxe. Un dos puntos centrais do debate foi o noso corpus multilingüe Gold Standard, fundamental para a avaliación dos métodos automáticos de anotación.

Tamén se definiu a forma de proceder durante a seguinte fase, que se centrará en probas comparativas para identificar os enfoques máis adecuados para a anotación ontolóxico-semántica en contexto. Neste sentido, revisáronse os criterios de anotación e os códigos empregados na comparación entre anotadores humanos.

A reunión serviu para consolidar os avances do proxecto e trazar a folla de ruta para a seguinte fase, centrada en probas metodolóxicas con integración de modelos de lingua co obxectivo de mellorar os resultados da anotación semántica multiligüe.

Continuamos traballando! 🚀