ESTIMACIÓN DE GRAMÁTICAS INCONTEXTUALES PROBABILÍSTICAS Y SU APLICACIÓN EN MODELIZACIÓN DEL LENGUAJE.

Autor: SÁNCHEZ PEIRÓ JOAN ANDREU
Año: 1998
Universidad: POLITECNICA DE VALENCIA
Centro de realización: DPTO. SISTEMAS INFORMÁTICOS Y COMPUTACIÓN
Centro de lectura: INFORMÁTICA
Director: BENEDÍ RUIZ JOSÉ MIGUEL
Tribunal: CASACUBERTA NOLLA FRANCISCO , DUPONT PIERRE , CARRASCO JIMÉNEZ RAFAEL , CASTELLANOS LÓPEZ ANTONIO , MARZAL VARÓ ANDRÉS
Resumen de la tesis

En esta tesis se estudian las Gramáticas Incontextuales Probabilísticas y su aplicación en problemas de Modelización del Lenguaje. Dos son los grandes problemas que se va a considerar en este tipo de modelos: el aprendizaje de las funciones de probabilidad asociadas a las reglas, y su integración como modelo de interpretación en tareas complejas de Modelización del Lenguaje. En primero de los problemas que se estudia es la estimación de las funciones de probabilidad asociadas a las reglas.Se presentan y estudian dos de los algoritmos clásicos de estimación de las GIP, el algoritmo Inside-Outside y el algoritmo basado en las cuentas de Viterbi. Después se proponen nuevos algoritmos de estimación en los cuales se utiliza un subconjunto específico de derivaciones e cada cadena. Finalmente,los algoritmos propuestos se aplican al conjunto de datos del Penn Treebank para ilustrar su comportamiento en la práctica. Por útlimo se aborda el problema de la interpretación e integración de las Gramáticas Incontextuales Probabilísticas en problemas de Modelización del Lenguaje. A continuación se hace una propuesta de integración que combina modelos de $n$-gramas a nivel de palabras con una Gramática Incontextual Probabilística a nivel de categorías léxicas.
Materias relacionadas