MultiComb (galego)

logo_multicomb

English version
Versión en español

Xerador multilingüe de estruturas argumentais do substantivo con aplicación na producción en linguas estranxeiras

MultiComb é un proxecto financiado por FEDER / Ministerio de Ciencia e Innovación – Axencia Estatal de Investigación (Proxecto FFI2017-82454-P) que ten como principal obxectivo deseñar un simulador para a xeración de contextos frasais e oracionais lingüisticamente aceptábeis para frases nominais en alemán, español e francés.

A idea de deseñar unha ferramenta como MultiComb nace en estreita relación cos resultados dun experimento preliminar sobre o substantivo ‘muerte’ (Valcárcel / Domínguez 2016), no que participantes anónimos avaliaron a aceptabilidade de frases nominais xeradas automaticamente. A análise levounos a concluír que a avaliación da aceptabilidade semántica das frases nominais xeradas automaticamente talvez se podería mellorar proporcionando un contexto de frase complexa así como un contexto oracional.

MultiComb aséntase no método combinado para a recollida e análise de datos sobre a combinatoria sintagmática e paradigmática do nome empregado no proxecto MultiGenera, que se aplica, desta volta, para a xeración de contextos oracionais coherentes e aceptábeis, á vez que máis familiares para un falante humano. Para este fin, resulta imprescindíbel xerar contexto a nivel frasal, por unha banda, e a nivel oracional, por outra.

Coa finalidade de formalizar o contexto da frase e facilitar o seu tratamento informático, aplicamos unha selección de funcións léxicas (FL) básicas seguindo a proposta de Mel’čuk (2013, 2015). O procedemento de selección dos diferentes representantes das FLs segue, en primeiro lugar, un criterio de frecuencia. A partir desta selección inicial, lévase a cabo un procedemento de expansión de prototipos, depuración e o seu posterior empaquetado paradigmático. Evidentemente, estes conxuntos paradigmáticos asociados a FL dependerán non só de cada substantivo, senón tamén das restricións léxicas específicas de cada un dos tres idiomas.

A xeración do contexto oracional, no que se xeran as frases nominais, atende en MultiComb a catro estruturas sintácticas centrais que responden a funcións léxicas básicas Func, Fact, Oper, Real e Pred:

Suxeito (NP) + Verbo: el olor a tabaco de la casa se disipó
Suxeito (NP) + Cópula + Atributo: el olor a tabaco de la casa resultaba insoportable
Suxeito + Verbo + Complemento Obxecto (NP): el vecindario sentía el olor a tabaco de la casa
Suxeito + Verbo + Complemento preposicional (Prep + NP): me enamoré del olor a campo de su ropa

Xeramos, por tanto, contextos de oración, en definitiva, exemplos cos patróns de valencia máis frecuentes.

O simulador MultiComb combina información suficiente, distintiva e orientada ao usuario —humano ou máquina— nun contexto de linguas estranxeiras en casos de produción. Como resultado final, os usuarios poden decidir nunha interface web os tipos de contexto que desexan obter así como filtrar os datos atendendo a criterios de combinatoria sintáctica e semántica.

 

MultiTools
Arttigos relacionados

Proxecto FFI2017-82454-P financiado por MCIN/AEI//10.13039/501100011033/ FEDER “Una manera de hacer Europa”