Ultimando el prototipo para MultiComb

Tras la pausa navideña, retomamos las reuniones preparatorias del prototipo de Multicomb con Daniel Bardanca, que asume las tareas de programación. La mayoría de las funcionalidades de la nueva herramienta ya están listas y sólo falta ultimar unos pocos detalles, aunque son esenciales. Además de los paquetes de léxico extraídos de Wordnet y de las frases nominales generadas con los prototipos de Multigenera (Xera y Combinatoria), el nuevo prototipo extraerá datos de las ediciones de Wikipedia en las tres lenguas meta del proyecto (castellano, francés y alemán). En este caso necesitamos verbos y adjetivos para generar contextos oracionales, aunque también se podrán extraer sustantivos. Otra funcionalidad interesante es la extracción de léxico teniendo en cuenta su posición con respecto al núcleo de la frase nominal, algo particularmente útil para su adjetivación en castellano y especialmente en francés. Se espera que el equipo lingüístico pueda estar usando el nuevo prototipo en las próximas semanas.