SISTEMAS HIBRIDOS CON APRENDIZAJE BASADOS EN MAQUINAS DE SOPORTE VECTORIAL Y REDES NEURONALES DE FUNCION DE BASE RADIAL

Autor: NUÑEZ CASTRO HAYDEMAR MARIA
Año: 2003
Universidad: POLITECNICA DE CATALUÑA
Centro de realización: ENGINYERIA DE SISTEMES, AUTOMATICA I INFORMATICA INDUSTRIAL
Centro de lectura: upc
Director: ANGULO BAHON CECILIO
Tribunal: LOZANO PEREZ TOMAS , AGELL JANE NURIA , CABESTANY MONCUSI JOAN , ORTEGA RAMiREZ JUAN ANTONIO , PARRA LLANAS F. XAVIER
Resumen de la tesis

La clasificación de la información generada por un proceso y recibida por un sistema de control o supervisión en un conjunto de categorías predefinidas es una de las áreas de trabajo principales de los sistemas inteligentes de control. Cuando los paradigmas de clasificación utilizados son del tipo conexionista, el sistema supervisor que se diseña, aún en el caso de obtener buenas prestaciones sobre el proceso, es del tipo caja negra, es decir, su interpretación por parte de un operario es difícil, cuando no imposible. Con el objetivo de convertir en interpretable el sistema clasificador, se han desarrollado en los últimos 10 años algunas aproximaciones que permiten extraer reglas a partir de, generalmente, redes neuronales basadas en funciones base radiales: una primera fase de entrenamiento de la RBFNN es necesaria, para posteriormente aplicar el algoritmo de extracción de reglas en una segunda etapa. En todos los casos, el algoritmo de extracción utilizado en la segunda etapa del procedimiento impone restricciones sobre el tipo de entrenamiento realizado durante la fase inicial, en especial, para evitar el ‘overlapping’ posterior entre clases o categorías. Por otra parte, en estos últimos 7 años se ha venido demostrando que las Máquinas de Soporte Vectorial (SVM), una implementación de la Teoría de Aprendizaje Estadístico de V.N. Vapnik, poseen unas cualidades de clasificación y aproximación excelentes sobre todo tipo de problemas, aún con un número reducido de patrones de aprendizaje, o una dimensión grande del espacio de trabajo inicial. Por ello, parecería interesante utilizar este tipo de sistema conexionista como base en la fase primera de entrenamiento. La presente tesis explota la estructura de generación de la función clasificadora tanto en el caso de las SVM, como de las RBFNN. En una SVM, al ser un clasificador de margen amplio, la función separadora se diseña sobre unos vectores soporte que son patrones cercanos a la frontera de separación entre clases. Por otra parte, tanto las RBFNN, como otros algoritmos de clustering como el SOM de Kohonen o los k-NN, basan su diseño en patrones centrados en las clases. Combinando ambos diseños, se disponen tanto de centros de las clases consideradas, como los extremos de la clase, aquellos cercanos a la frontera, por lo que el problema de ‘overlapping’ se puede salvar de forma efectiva. Partiendo de los vectores soportes seleccionados por una SVM (patrones en la frontera) y cualquier algoritmo de clustering incremental o una RBFNN para obtener vectores prototipo (aquellos centrados en la clase) la tesis propone un método de extracción de reglas en forma de hiper-elipsoide independiente del tipo de entrenamiento utilizado en la fase inicial. Aún más, con el objetivo de facilitar la interpretación de las reglas, se propone una segunda derivación en forma de hiper-rectángulos. Los numerosos experimentos realizados, tanto en bases de datos artificiales como en repositorios estándares en el área del aprendizaje automático, muestran de forma definitiva la viabilidad de la propuesta. Como extensión y aportación más novedosa de la tesis, el algoritmo es modificado para ser tratado sólo sobre la base de información de una SVM con el objetivo de eliminar la variabilidad intrínseca en la clasificación realizada por los algoritmos de clustering o las RBFNN. Puesto que la información final vendrá expresada en forma de reglas interpretables por el operario, una tercera aportación en la tesis es la de analizar sistemas de inserción de conocimiento en la SVM, cuando éste está disponible en forma de reglas. Las diferentes alternativas estudiadas permiten concluir que el acceso por parte de la SVM a este tipo de información mejora su rendimiento final.
Materias relacionadas