MultiComb

Home / MultiComb
logo_multicomb

Generador multilingüe de estructuras argumentales del sustantivo con aplicación en la producción en lenguas extranjeras

MultiComb es un proyecto financiado por el Ministerio de Economía, Industria y Competitividad (programa Excelencia, FFI2017-82454-P) que tiene como principal objetivo diseñar un simulador para la generación de contextos frasales y oracionales lingüísticamente aceptables para frases nominales en alemán, español y francés.

La idea de diseñar una herramienta como MultiComb nace en estrecha relación con los resultados de un experimento preliminar sobre el sustantivo ‘muerte’ (Valcárcel / Domínguez 2016), en el que participantes anónimos evaluaron la aceptabilidad de frases nominales generadas automáticamente. El análisis nos llevó a concluir que la evaluación de la aceptabilidad semántica de las frases nominales generadas automáticamente tal vez podría mejorarse proporcionando un contexto de frase compleja así como un contexto oracional.

MultiComb se asienta en el método combinado para la recogida y análisis de datos sobre la combinatoria sintagmática y paradigmática del nombre empleado en el proyecto MultiGenera, aplicándose este, a su vez, para la generación de contextos oracionales coherentes y aceptables, a la vez que más familiares para un hablante humano. Para este fin, resulta imprescindible generar contexto a nivel frasal, por un lado, y a nivel oracional, por otro.

Con la finalidad de formalizar el contexto de la frase  y facilitar su tratamiento informático, aplicamos una selección de funciones léxicas (FL) básicas siguiendo la propuesta de Mel’čuk (2013, 2015). El procedimiento de selección de los diferentes representantes de las FLs sigue, en primer lugar,  un criterio de frecuencia. A partir de esta selección inicial, depuramos y empaquetamos por prototipos léxicos para cada FL. y su adjudicación a una FL, se lleva a cabo un procedimiento de expansión de prototipos, depuración y su posterior empaquetado paradigmático. Evidentemente, estos conjuntos paradigmáticos asociados a LF dependerán no sólo de cada sustantivo, sino también de las restricciones léxicas específicas de cada uno de los tres idiomas.

La generación del contexto oracional, en las que se generan las frases nominales, atiende en MultiComb a cuatro estructuras sintácticas centrales que responden a funciones léxicas básicas Func, Fact, Oper, Real y Pred:

Sujeto (NP) + Verbo: el olor a tabaco de la casa se disipó
Subjeto (NP) + Copula + Atributo: el olor a tabaco de la casa resultaba insoportable
Subjeto + Verbo + Complemento Objeto (NP): el vecindario sentía el olor a tabaco de la casa
Subject+Verbo+Complemento prepositivo (Prep + NP): Me enamoré del olor a campo de su ropa

Generamos, por tanto,  contextos de oración, en definitiva, ejemplos con los patrones de valencia más frecuentes.

El simulador MultiComb combina información suficiente, distintiva y orientada al usuario —humano o máquina— en un contexto de lenguas extranjeras en casos de producción. Como resultado final, los usuarios pueden decidir en una interfaz web los tipos de contexto que desean obtener así como filtrar los datos atendiendo a criterios de combinatoria sintáctica y semántica.

 

MultiTools
Artículos relacionados