APRENDIZAJE AUTOMATICO DE MODELOS K-EXPLORABLES ESTOCASTICOS EN RECONOCIMIENTO DEL HABLA.

Autor: BORDEL GARCIA GERMAN
Año: 1995
Universidad: PAIS VASCO
Centro de realización: DEPARTAMENTO: ELECTRICIDAD Y ELECTRONICA PROGRAMA DE DOCTORADO: BIENIO 88-90
Centro de lectura: CIENCIAS
Director: VIDAL RUIZ ENRIQUE
Tribunal: CASACUBERTA NOLLA FRANCISCO , MARIÑO ACEBAL JOSE B. , RUBIO AYUSO ANTONIO J. , BENEDI RUIZ JOSE M. , TARELA PEREIRO JOSE M.
Resumen de la tesis

EL PRESENTE TRABAJO TRATA SOBRE LA OBTENCION DE MODELOS DEL LENGUAJE BAJO UNA OPTICA CONCRETA. POR UN LADO SE TRATA DE MODELOS ESTOCASTICOS, ES DECIR, QUE DETERMINAN LA PROBABILIDAD DE QUE UNA PALABRA DEL VOCABULARIO PROPIO DEL LENGUAJE OCUPE UNA POSICION DADA EN EL DISCURSO EN FUNCION DEL RESTO DEL MISMO. POR OTRO LADO, FRENTE AL ENFOQUE CONOCIDO COMO "BASADO EN EL CONOCIMIENTO" O ENFOQUE DEDUCTIVO, SE APLICA LO QUE SE CONOCE COMO "APRENDIZAJE AUTOMATICO" O ENFOQUE INDUCTIVO. DESDE LOS COMIENZOS DE LA APLICACION DE ESTE ENFOQUE SE VIENEN UTILIZANDO LO QUE SE CONOCE COMO "N-GRAMAS", SIN EMBARGO DESDE HACE ALGUN TIEMPO SE CONSIDERA QUE LA UTILIZACION DE TECNICAS DE INFERENCIA DE GRAMATICAS ESTOCASTICAS PROPORCIONA UN PLANTEAMIENTO MAS AMPLIO DEL PROBLEMA. RECIENTEMENTE SE HA DEMOSTRADO QUE LAS TECNICAS DE INFERENCIA DE GRAMATICAS PERMITEN OBTENER COMO CASO PARTICULAR MODELOS DE N-GRAMAS YA QUE ESTOS COINCIDEN CON LOS GENERADOS PARA LOS LENGUAJES CONOCIDOS COMO K-EXPLORABLES EN SENTIDO ESTRICTO (K-EE), ELEMENTO CENTRAL EN ESTE TRABAJO. LA MEMORIA COMIENZA ENMARCANDO LA MODELIZACION DEL LENGUAJE (ML) DENTRO DEL RECONOCIMIENTO AUTOMATICO DEL HABLA (RAH) PARA PASAR A CONTINUACION A HACER UNA REVISION SOBRE ML POR METODOS DE APRENDIZAJE AUTOMATICO. EN TODO MOMENTO SE EXPLICITA COMO ENCAJA LA TECNICA CLASICA DE "N-GRAMAS" EN CADA UNA DE LAS DEMAS. SITUANDOLOS EN EL LUGAR QUE LES CORRESPONDE DENTRO DE ESTA REVISION, SE FORMALIZA UN MODELO GRAMATICAL PARA LOS LENGUAJES K-EE Y SE HACE UN ESTUDIO EXPERIMENTAL SOBRE SUS CARACTERISTICAS ESTRUCTURALES. POSTERIORMENTE SE REALIZA UN ANALISIS DE LA PROBLEMATICA DE LA ESTIMACION DE PROBABILIDADES EN LOS MODELOS, ORIGINADA POR LA FINITUD DE TODO CORPUS DE MUESTRAS. SE PRESENTAN LAS SOLUCIONES QUE SE ENCUENTRAN EN LA BIBLIOGRAFIA (LOS METODOS DE SUAVIZADO) PARA PASAR A LA PRESENTACION DE UN ESTUDIO EXPERIMENTAL DE LAS CARACTERISTICAS DE LAS DISTRIBUCIONES DE PROBABILIDAD DE LOS MODELOS PARA LENGUAJES K-EE. A CONTINUACION SE PROPONEN Y ANALIZAN METODOS ALTERNATIVOS DE SUAVIZADO PARTIENDO DEL MEJOR METODO CONVENCIONAL VISTO EN EL CAPITULO ANTERIOR Y ELIMINANDO SUS INCONVENIENTES CON EL OBJETIVO DE INCLUIRLOS EN LA ESTRUCTURA DEL FORMALISMO PARA LOS LENGUAJES K-EE ESTABLECIDO ANTERIORMENTE. POR ULTIMO SE INTEGRA EN UN MODELO UNICO DE TIPO GRAMATICAL LAS NUEVAS TECNICAS DE SUAVIZADO DANDO LUGAR A MODELOS DE LENGUAJE DE FACIL APLICACION EN RAH QUE SE HAN DENOMINADO MODELOS K-EES. PARA ESTABLECER ESTE TIPO DE MODELOS SE HA DEFINIDO UN NUEVO TIPO DE AUTOMATAS DE ESTADOS FINITOS DETERMINISTAS (AEFD) QUE SE HAN DENOMINADO AEFDTR (AEFD CON TRANSICIONES RECURSIVAS). PARA LOS MODELOS K-EES SE ABORDAN ASPECTOS COMPUTACIONALES Y SE ANALIZA SU COMPOSICION Y EL EFECTO DE UNA "PODA" SOBRE SU COMPLEJIDAD Y CALIDAD.