Random Forest for Audio-Visual Speech Recognition

Sad, Gonzalo Daniel; Terissi, Lucas Daniel; Gómez, Juan Carlos

Mostrar el registro sencillo del ítem

dc.contributor.author

Sad, Gonzalo Daniel Se ha confirmado la validez de este valor de autoridad por un usuario

dc.contributor.author

Terissi, Lucas Daniel Se ha confirmado la validez de este valor de autoridad por un usuario

dc.contributor.author

Gómez, Juan Carlos Se ha confirmado la validez de este valor de autoridad por un usuario

dc.contributor.other

Clary, Thomas S.

dc.date.available

2023-06-26T14:09:55Z

dc.date.issued

2020

dc.identifier.citation

Sad, Gonzalo Daniel; Terissi, Lucas Daniel; Gómez, Juan Carlos; Random Forest for Audio-Visual Speech Recognition; Nova Science Publishers; 19; 2020; 175-221

dc.identifier.isbn

978-1-53618-359-7

dc.identifier.uri

http://hdl.handle.net/11336/201513

dc.description.abstract

In this chapter, a review of different methods for Audio-Visual Speech Recognition (AVSR) using Random Forest, is presented. First, a strategy based on the combination of Wavelet multiresolution analysis and Random Forest is proposed. The temporal evolution of the input speech data is represented by a set of wavelet-based features. Then, a Random Forest classifier is employed to carry out the speech recognition task. Second, a novel scheme based on the combination in a cascade wise of two classifiers, Random Forest and Complementary Random Forest, is proposed. Different from Random Forest which is trained with instances of each particular class, the Complementary Random Forest is trained with instances of all the remaining classes. The performance of the proposed speech recognition methods is evaluated in different scenarios, namely, considering only acoustic information, only visual information (lip-reading), and fused audiovisual information. These evaluations are carried out over three different audiovisual databases, two of them public ones and the remaining one compiled by the authors of this chapter. Experimental results show that a good performance is achieved with the proposed methods over the three databases and for the different kinds of input information being considered.

dc.format

application/pdf

dc.language.iso

eng

dc.publisher

Nova Science Publishers Se ha confirmado la validez de este valor de autoridad por un usuario

dc.rights

info:eu-repo/semantics/restrictedAccess

dc.rights.uri

https://creativecommons.org/licenses/by-nc-sa/2.5/ar/

dc.subject

SPEECH RECOGNITION

dc.subject

AUDIO-VISUAL

dc.subject

RANDOM FOREST

dc.subject.classification

Otras Ciencias de la Computación e Información Se ha confirmado la validez de este valor de autoridad por un usuario

dc.subject.classification

Ciencias de la Computación e Información Se ha confirmado la validez de este valor de autoridad por un usuario

dc.subject.classification

CIENCIAS NATURALES Y EXACTAS Se ha confirmado la validez de este valor de autoridad por un usuario

dc.title

Random Forest for Audio-Visual Speech Recognition

dc.type

info:eu-repo/semantics/publishedVersion

dc.type

info:eu-repo/semantics/bookPart

dc.type

info:ar-repo/semantics/parte de libro

dc.date.updated

2021-09-06T20:57:37Z

dc.journal.volume

19

dc.journal.pagination

175-221

dc.journal.pais

Estados Unidos Se ha confirmado la validez de este valor de autoridad por un usuario

dc.journal.ciudad

Nueva York

dc.description.fil

Fil: Sad, Gonzalo Daniel. Universidad Nacional de Rosario. Facultad de Ciencias Exactas, Ingeniería y Agrimensura; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Rosario. Centro Internacional Franco Argentino de Ciencias de la Información y de Sistemas. Universidad Nacional de Rosario. Centro Internacional Franco Argentino de Ciencias de la Información y de Sistemas; Argentina

dc.description.fil

Fil: Terissi, Lucas Daniel. Universidad Nacional de Rosario. Facultad de Ciencias Exactas, Ingeniería y Agrimensura; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Rosario. Centro Internacional Franco Argentino de Ciencias de la Información y de Sistemas. Universidad Nacional de Rosario. Centro Internacional Franco Argentino de Ciencias de la Información y de Sistemas; Argentina

dc.description.fil

Fil: Gómez, Juan Carlos. Universidad Nacional de Rosario. Facultad de Ciencias Exactas, Ingeniería y Agrimensura; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Rosario. Centro Internacional Franco Argentino de Ciencias de la Información y de Sistemas. Universidad Nacional de Rosario. Centro Internacional Franco Argentino de Ciencias de la Información y de Sistemas; Argentina

dc.relation.alternativeid

info:eu-repo/semantics/altIdentifier/url/https://novapublishers.com/shop/horizons-in-computer-science-research-volume-19/

dc.conicet.paginas

260

dc.source.titulo

Horizons in Computer Science Research

Archivos asociados

Tamaño: 382.0Kb

Formato: PDF

Solicitar