APRENDIZAJE CON MÁQUINAS NÚCLEO EN ENTORNOS DE MULTICLASIFICACIÓN

Autor: ANGULO BAHON CECILIO
Año: 2000
Universidad: POLITECNICA DE CATALUÑA
Centro de realización:
Centro de lectura: MATEMATICAS
Director: CATALA MALLOFRE ANDRES
Tribunal: AGUILAR MARTIN JOSEPH , CABESTANY MONCUSI JOAN , ARTES RODRIGUEZ ANTONIO , AGELL JANE NURIA , FUERTES ARMENGOL JOSE MARÍA
Resumen de la tesis

La propiedad de generalización de una máquina de aprendizaje, es decir su capacidad para emitir una respuesta correcta ante una nueva entrada semejante a quellas con las que ha sido entrenada, es la característica principal que se busca en los sistemas conexionistas supervisados y sirve de justificación en la elección de los principios inductivos y el tipo de esructuras de aprendizaje para elaborar el presente estudio. La regularización o penalización es uno de estos principios que favorecen a nivel teórico la generalización, sobre el cual se ha desarrollado un método de cálculo directo de la matriz de regularización cuando se utiliza como estabilizador un operador diferencial de segundo grado, precisamente aquel que minimiza el grado de convexidad de la función solución, evitando así el proceso iterativo de cálculo de la matriz hessiana y fijando el tipo de núcleo a ser utilizado. Los nexos de unión entre la regularización y el principio de minimización del riesgo estructural así como las excelentes características teóricas mostradas por este último principio trabajando, por definición, sobre conjuntos finitos de datos y expandiendo su solución sobre un número pequeño de núcleos, han llevado a desplazar el foco de trabajo de numerosos investigadores hacia las máquinas de soporte vectorial, su materialización procedimental. En este contexto, se ha desarrollado una máquina que permite extender de forma natural el comportamiento binario de estas máquinas núcleo de margen máximo sobre problemas de clasificación hacia una solución ternaria más acorde con la estructura geométrica de los datos, en especial en las situaciones habituales de espacios de salida que poseen más de dos clases. El uso de la nueva arquitectura, bautizada K-SVCR, en problemas de multiclasificación resulta más adecuado que las reducciones estándares de problemas multiclase sobre maquinas biclasificadoras en estructuras en paralelo o arbóreas puesto que cada nodo de dicotomía considera todo el espacio de entrenamiento y se fuerza al hiperplano de separacióna considerar la estructura geomètrica de los patrones de entrenamiento. En especial, se demuestra la robustez del nuevo método ante fallos en las predicicones de algunos de sus nodos de trabajo cuando se considera un tipo especial de combinación de estas respuestas. La nueva arquitectura de multiclasificación ha sido modificada conposterioridad para ser implementada sobre un problema de clasificción con características independientes, la ordenación o problema de aprendizaje de preferncias. Sus prestaciones son evaluadas sobre una aplicación financiera en la determinación de riesgos crediticios. Finalmente, una aplicación de categorizacióno discriminación de escenarios de depuración donde incide el efecto de la temporalidad sirve también como ejemplo de funcionamiento.
Materias relacionadas