Artículo
En este trabajo se presentan los resultados de los experimentos llevados a cabo con un sistema de reconocimiento automático de habla continua para el español de Argentina. El reconocedor implementado basado en palabras utilizó unidades independientes del contexto, denominadas en la literatura “monofonos”, como unidades básicas del modelo acústico. Para la creación de dichos modelos se emplearon modelos ocultos de Markov HMM (Hidden Markov Models) de 3 estados de izquierda a derecha del tipo semi-continuo “SC-HMM” asociados a cada uno de los 31 monofonos (30 fonemas + alófonos y un modelo de silencio). La base de datos acústica estuvo conformada por 741 oraciones con 2.837 palabras distintas, que cubren el 97% de las sílabas del español, emitidas en una cámara acústica por dos locutores profesionales. Los valores óptimos de los parámetros fueron seleccionados para maximizar la tasa de reconocimiento y simultáneamente reducir el tiempo de procesamiento. La tasa de reconocimiento promedio obtenida (%Acc), empleando la metodología de “validación cruzada de 10 particiones”, fue del 97.87% con una tasa de tiempo real (%RT) del 34.98%. This paper presents the results obtained with a continuous speech recognition system for Argentine Spanish. The word-based recognizer used context-independent units, monophones, as basic units of the acoustical model. Modeling used three left-to-right states semi-continuous Hidden Markov Models SC-HMM associated to 31 monophones (30 phonemes and a silence model). The acoustical database included 741 sentences with 2837 different words –97% of Spanish syllables– recorded at an acoustic chamber by two professional announcers. The optimal values of the recognizer parameters were selected in order to maximize the recognition rate and simultaneously to reduce the execution time. The optimal average accuracy (%Acc) obtained, using 10-fold cross validation method, was 97.87% with a Real-Time Rate (%RT) of 34.98%.
Reconocedor de habla continua independiente del contexto para el español de Argentina
Fecha de publicación:
07/2009
Editorial:
Universidad Autónoma de Colombia
Revista:
Clepsidra
ISSN:
1900-1355
Idioma:
Español
Tipo de recurso:
Artículo publicado
Clasificación temática:
Resumen
Archivos asociados
Licencia
Identificadores
Colecciones
Articulos(INIGEM)
Articulos de INSTITUTO DE INMUNOLOGIA, GENETICA Y METABOLISMO
Articulos de INSTITUTO DE INMUNOLOGIA, GENETICA Y METABOLISMO
Citación
Univaso, Pedro Nicolas; Gurlekian, Jorge Alberto; Evin, Diego Alexis; Reconocedor de habla continua independiente del contexto para el español de Argentina; Universidad Autónoma de Colombia; Clepsidra; 5; 8; 7-2009; 13-22
Compartir
Altmétricas