INTEGRACION DE AUDIO Y VIDEO EN RECONOCIMIENTO BIOMETRICO

Autor: CRUZ LLANAS SANTIAGO
Año: 2004
Universidad: POLITECNICA DE MADRID
Centro de realización: ETSI TELECOMUNICACION
Centro de lectura: E.S.T. INGENIEROS TELECOMUNICACION
Director: ORTEGA GARCIA JAVIER
Tribunal: GARCIA SANTOS NARCISO , GONZALEZ RODRIGUEZ JOAQUIN , LLEIDA SOLANO EDUARDO , SIGUENZA PIZARRO JUAN ALBERTO , HERNANDEZ GOMEZ LUIS ALFONSO
Resumen de la tesis

La Tesis recoge un detallado estudio de las tecnologías de reconocimiento de locutor y de identificación facial, planteando y analizando diferentes estrategias de fusión de ambas tecnologías biometricas. La Tesis se divide en dos partes fundamentales. La primera es una introducción al ámbito de la biometría y una presentación del estado del arte en todos los temas que se abordan posteriormente desde una perspectiva práctica: verificación biométrica, reconocimiento de locutor, reconocimiento facila y biometría multimodal voz-cara. En la segunda parte de la Tesis se describen sistemas de reconocimiento de locutor y reconocimiento facial. En reconocimiento de voz se utiliza parametrización MFCC y modelos de mezclas gaussianas (GMM) entrenados mediante técnicas MAP. En reconocimiento facial se analizan diferentes diseños, aunque se presta mayor atención a los métodos relacionados con álgebra lineal, reducción de la dimensión y modelos estadísticos (PCA, LDA, etc.). La parte más innovadora de la Tesis es la correspondiente a fusión multimodal. Se analizan formas de combinar las puntuaciones ofrecidas por los reconocedores de voz y cara. Se proponen métodos de normalización de puntuaciones y diferentes reglas de fusión. Todos los experimentos realizados en la Tesis siguen el protocolo de evaluación de Lausanne asociado a la base de datos XM2VTS.