O pasado 31 de xaneiro de 2025, o Campus de Pontevedra da Universidade de Vigo acolleu un novo encontro do proxecto ESMAS-ES+ (PID2022-137170OB-I00), organizado por Carlos Valcárcel. Ao longo da xornada, o equipo encargado dos aspectos estatístico-computacionais analizou diferentes estratexias para optimizar a anotación semántica automática en corpora lingüísticos, garantindo a súa sostibilidade.
A sesión contou coa participación de José João Almeida (Universidade do Minho) e José Ramom Pichel (CITIUS) como consultores externos, que achegaron contribucións chave para a validación metodolóxica e a extracción de datos lingüísticos desde unha perspectiva computacional. Desde aquí, obrigado!
Durante o encontro, avanzouse na optimización das ferramentas de anotación multilingüe, explorando a integración de modelos como BERT e grandes modelos de lingua (LLM). Ademais, deseñouse un plan de probas metodolóxicas para avaliar a calidade das anotacións e perfeccionar os criterios de etiquetaxe. Un dos puntos centrais do debate foi o noso corpus multilingüe Gold Standard, fundamental para a avaliación dos métodos automáticos de anotación.
Tamén se definiu a forma de proceder durante a seguinte fase, que se centrará en probas comparativas para identificar os enfoques máis adecuados para a anotación ontolóxico-semántica en contexto. Neste sentido, revisáronse os criterios de anotación e os códigos empregados na comparación entre anotadores humanos.
![](http://portlex.usc.gal/site/wp-content/uploads/2025/02/WhatsApp-Image-2025-02-02-at-20.38.19-300x225.jpeg)