Mostrar el registro sencillo del ítem
dc.contributor.author
Sad, Gonzalo Daniel
dc.contributor.author
Terissi, Lucas Daniel
dc.contributor.author
Gómez, Juan Carlos
dc.contributor.other
Clary, Thomas S.
dc.date.available
2023-06-26T14:09:55Z
dc.date.issued
2020
dc.identifier.citation
Sad, Gonzalo Daniel; Terissi, Lucas Daniel; Gómez, Juan Carlos; Random Forest for Audio-Visual Speech Recognition; Nova Science Publishers; 19; 2020; 175-221
dc.identifier.isbn
978-1-53618-359-7
dc.identifier.uri
http://hdl.handle.net/11336/201513
dc.description.abstract
In this chapter, a review of different methods for Audio-Visual Speech Recognition (AVSR) using Random Forest, is presented. First, a strategy based on the combination of Wavelet multiresolution analysis and Random Forest is proposed. The temporal evolution of the input speech data is represented by a set of wavelet-based features. Then, a Random Forest classifier is employed to carry out the speech recognition task. Second, a novel scheme based on the combination in a cascade wise of two classifiers, Random Forest and Complementary Random Forest, is proposed. Different from Random Forest which is trained with instances of each particular class, the Complementary Random Forest is trained with instances of all the remaining classes. The performance of the proposed speech recognition methods is evaluated in different scenarios, namely, considering only acoustic information, only visual information (lip-reading), and fused audiovisual information. These evaluations are carried out over three different audiovisual databases, two of them public ones and the remaining one compiled by the authors of this chapter. Experimental results show that a good performance is achieved with the proposed methods over the three databases and for the different kinds of input information being considered.
dc.format
application/pdf
dc.language.iso
eng
dc.publisher
Nova Science Publishers
dc.rights
info:eu-repo/semantics/restrictedAccess
dc.rights.uri
https://creativecommons.org/licenses/by-nc-sa/2.5/ar/
dc.subject
SPEECH RECOGNITION
dc.subject
AUDIO-VISUAL
dc.subject
RANDOM FOREST
dc.subject.classification
Otras Ciencias de la Computación e Información
dc.subject.classification
Ciencias de la Computación e Información
dc.subject.classification
CIENCIAS NATURALES Y EXACTAS
dc.title
Random Forest for Audio-Visual Speech Recognition
dc.type
info:eu-repo/semantics/publishedVersion
dc.type
info:eu-repo/semantics/bookPart
dc.type
info:ar-repo/semantics/parte de libro
dc.date.updated
2021-09-06T20:57:37Z
dc.journal.volume
19
dc.journal.pagination
175-221
dc.journal.pais
Estados Unidos
dc.journal.ciudad
Nueva York
dc.description.fil
Fil: Sad, Gonzalo Daniel. Universidad Nacional de Rosario. Facultad de Ciencias Exactas, Ingeniería y Agrimensura; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Rosario. Centro Internacional Franco Argentino de Ciencias de la Información y de Sistemas. Universidad Nacional de Rosario. Centro Internacional Franco Argentino de Ciencias de la Información y de Sistemas; Argentina
dc.description.fil
Fil: Terissi, Lucas Daniel. Universidad Nacional de Rosario. Facultad de Ciencias Exactas, Ingeniería y Agrimensura; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Rosario. Centro Internacional Franco Argentino de Ciencias de la Información y de Sistemas. Universidad Nacional de Rosario. Centro Internacional Franco Argentino de Ciencias de la Información y de Sistemas; Argentina
dc.description.fil
Fil: Gómez, Juan Carlos. Universidad Nacional de Rosario. Facultad de Ciencias Exactas, Ingeniería y Agrimensura; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Rosario. Centro Internacional Franco Argentino de Ciencias de la Información y de Sistemas. Universidad Nacional de Rosario. Centro Internacional Franco Argentino de Ciencias de la Información y de Sistemas; Argentina
dc.relation.alternativeid
info:eu-repo/semantics/altIdentifier/url/https://novapublishers.com/shop/horizons-in-computer-science-research-volume-19/
dc.conicet.paginas
260
dc.source.titulo
Horizons in Computer Science Research
Archivos asociados