Este documento describe el análisis, diseño e implementación de un sistema de búsqueda de audio mediante la integración de reconocimiento automático de voz y búsqueda por indexación. El objetivo principal fue investigar tecnologías de reconocimiento de voz y diseñar una arquitectura que permita extraer transcripciones de audio para almacenarlas e indexarlas, permitiendo búsquedas eficientes. Se implementó un prototipo web que usa un motor de reconocimiento de voz comercial. Las pruebas mostraron que el sistema puede encontrar resultados relevantes
19. RENDIMIENTO DE BÚSQUEDA Prueba 1 Prueba 2 Prueba 3 Cantidad de documentos total en el índice 10000 100000 250000 Tamaño resultante del índice 12.4 MB 125 MB 300 MB Tiempo promedio para cada consulta 4.17ms 16.78 ms 35.84 ms Desviación estándar de los tiempos de consulta 17.3 ms 13.29 ms 15.49 ms Máximo tiempo registrado 174 ms 130 ms 155 ms Mínimo tiempo registrado 1 ms 11 ms 26 ms
20. PRECISIÓN DEL MOTOR DE RECONOCIMIENTO DE VOZ Transcripción Palabras reconocidas correctamente Total de palabras reconocidas Precisión Transcripción1 123 385 32% Transcripción2 53 171 31% Transcripción3 136 230 60% Total 312 786 40%
21. RETENTIVA DEL MOTOR DE RECONOCIMIENTO DE VOZ Transcripción Palabras reconocidas correctamente Total de palabras en el audio Retentiva Transcripción1 123 277 44% Transcripción2 53 134 39% Transcripción3 136 302 45% Total 312 713 44%