MultiGenera

English version
Versión en galego
Generación multilingüe de estructuras argumentales del sustantivo y automatización de extracción de datos sintáctico-semánticos
MultiGenera es un proyecto de investigación financiado por la Fundación BBVA, que tiene como objetivo diseñar un prototipo para generar automáticamente frases nominales en español, alemán y francés. La herramienta MultiGenera posibilita, por tanto, la generación automática de realizaciones argumentales nominales dotadas de información semántica.
Este simulador multilingüe bebe de las fuentes de la gramática y lexicografía valencial (Engel, Mel’čuk, etc.) y de los trabajos sobre ontologías para redes semánticas como WordNet y sobre otros recursos de Procesamiento de Lenguaje Natural (PLN), lo cual permitirá un análisis onomasiológico-conceptual de diferentes campos léxico-conceptuales de modo monolingüe e interlingüístico y una aproximación comparativa y contrastiva a los sustantivos representantes de diferentes campos léxico-conceptuales.
Para el desarrollo del multigenerador ha sido necesario desarrollar un método combinado para la recogida y análisis de datos sobre la combinatoria sintagmática y paradigmática del nombre:
Dicho método se basa, en definitiva, en la extracción automática de datos desde recursos PLN, en el análisis de corpora, bases de datos de coocurrencias, Wordnets y en la evaluación de datos que arrojará el propio multigenerador MultiGenera para el español, alemán y francés.
Los resultados de este proyecto se concretan en el estudio de la viabilidad del prototipo del simulador atendiendo a la combinación de métodos y a la interoperabilidad de recursos así como al desarrollo de la propia herramienta MultiGenera.
Como citar:
María José Domínguez Vázquez / Carlos Valcárcel Riveiro / David Lindemann: Multilingual Generation of Noun Valency Patterns for Extracting Syntactic-Semantical Knowledge from Corpora (MultiGenera). En Jaka Čibej / Vojko Gorjanc / Iztok Kosem / Simon Krek: Proceedings of the XVIII EURALEX International Congress: Lexicography in Global Contexts (ISBN 978-961-06-0097-8), Ljubljana, Slovenia: Ljubljana University Press, 847-854.