Reconocedor de habla continua independiente del contexto para el español de Argentina

Univaso, Pedro Nicolas; Gurlekian, Jorge Alberto; Evin, Diego Alexis

doi:10.26564/19001355.273

Artículo

Reconocedor de habla continua independiente del contexto para el español de Argentina

Univaso, Pedro Nicolas; Gurlekian, Jorge Alberto Icon

; Evin, Diego Alexis Icon

Fecha de publicación: 07/2009

Editorial: Universidad Autónoma de Colombia

Revista: Clepsidra

ISSN: 1900-1355

Idioma: Español

Tipo de recurso: Artículo publicado

Clasificación temática:

Otras Ciencias de la Computación e Información

Resumen

En este trabajo se presentan los resultados de los experimentos llevados a cabo con un sistema de reconocimiento automático de habla continua para el español de Argentina. El reconocedor implementado basado en palabras utilizó unidades independientes del contexto, denominadas en la literatura “monofonos”, como unidades básicas del modelo acústico. Para la creación de dichos modelos se emplearon modelos ocultos de Markov HMM (Hidden Markov Models) de 3 estados de izquierda a derecha del tipo semi-continuo “SC-HMM” asociados a cada uno de los 31 monofonos (30 fonemas + alófonos y un modelo de silencio). La base de datos acústica estuvo conformada por 741 oraciones con 2.837 palabras distintas, que cubren el 97% de las sílabas del español, emitidas en una cámara acústica por dos locutores profesionales. Los valores óptimos de los parámetros fueron seleccionados para maximizar la tasa de reconocimiento y simultáneamente reducir el tiempo de procesamiento. La tasa de reconocimiento promedio obtenida (%Acc), empleando la metodología de “validación cruzada de 10 particiones”, fue del 97.87% con una tasa de tiempo real (%RT) del 34.98%.

This paper presents the results obtained with a continuous speech recognition system for Argentine Spanish. The word-based recognizer used context-independent units, monophones, as basic units of the acoustical model. Modeling used three left-to-right states semi-continuous Hidden Markov Models SC-HMM associated to 31 monophones (30 phonemes and a silence model). The acoustical database included 741 sentences with 2837 different words –97% of Spanish syllables– recorded at an acoustic chamber by two professional announcers. The optimal values of the recognizer parameters were selected in order to maximize the recognition rate and simultaneously to reduce the execution time. The optimal average accuracy (%Acc) obtained, using 10-fold cross validation method, was 97.87% with a Real-Time Rate (%RT) of 34.98%.

Palabras clave: Reconocimiento Automático de Habla , Español de Argentina , Tasa de Tiempo Real , Modelos Ocultos de Markov

Ver el registro completo

Archivos asociados

Tamaño: 854.3Kb

Formato: PDF

Descargar

Licencia

Excepto donde se diga explícitamente, este item se publica bajo la siguiente descripción: Creative Commons Attribution-NonCommercial-ShareAlike 2.5 Unported (CC BY-NC-SA 2.5)

Identificadores

URI: http://hdl.handle.net/11336/113289

DOI: http://dx.doi.org/10.26564/19001355.273

URL: http://revistas.fuac.edu.co/index.php/clepsidra/article/view/273

Colecciones

Articulos(INIGEM)
Articulos de INSTITUTO DE INMUNOLOGIA, GENETICA Y METABOLISMO

Citación

Univaso, Pedro Nicolas; Gurlekian, Jorge Alberto; Evin, Diego Alexis; Reconocedor de habla continua independiente del contexto para el español de Argentina; Universidad Autónoma de Colombia; Clepsidra; 5; 8; 7-2009; 13-22

Altmétricas