Repositorio Institucional
Repositorio Institucional
CONICET Digital
  • Inicio
  • EXPLORAR
    • AUTORES
    • DISCIPLINAS
    • COMUNIDADES
  • Estadísticas
  • Novedades
    • Noticias
    • Boletines
  • Ayuda
    • General
    • Datos de investigación
  • Acerca de
    • CONICET Digital
    • Equipo
    • Red Federal
  • Contacto
JavaScript is disabled for your browser. Some features of this site may not work without it.
  • INFORMACIÓN GENERAL
  • RESUMEN
  • ESTADISTICAS
 
Capítulo de Libro

Disambiguating Conflicting Classification Results in AVSR

Título del libro: Intelligent Speech Signal Processing

Sad, Gonzalo DanielIcon ; Terissi, Lucas DanielIcon ; Gómez, Juan Carlos
Otros responsables: Dey, Nilanjan
Fecha de publicación: 2019
Editorial: Elsevier
ISBN: 978-0-12-818130-0
Idioma: Inglés
Clasificación temática:
Otras Ciencias de la Computación e Información

Resumen

A novel scheme for disambiguating conflicting classification results in Audio-Visual Speech Recognition (AVSR) applications is proposed in this paper. The classification scheme can be implemented with both generative and discriminative models and can be used with different input modalities, viz. only audio, only visual, and audio visual information. The proposed scheme consists of the cascade connection of a standard classifier, trained with instances of each particular class, followed by a complementary model which is trained with instances of all the remaining classes. The performance of the proposed recognition system is evaluated on three publicly available audio-visual datasets, and using a generative model, namely a Hidden Markov Model, and three discriminative techniques, viz. Random Forests, Support Vector Machines, and Adaptive Boosting. The experimental results are promising in the sense that for the three datasets, the different models, and the different input modalities, improvements in the recognition rates are achieved in comparison to other methods reported in the literature over the same datasets.
Palabras clave: SPEECH CLASSIFICATION , AUDIO-VISUAL SPEECH , COMPLEMENTARY MODELS , CLASSIFIER COMBINATION
Ver el registro completo
 
Archivos asociados
Tamaño: 1.078Mb
Formato: PDF
.
Solicitar
Licencia
info:eu-repo/semantics/restrictedAccess Excepto donde se diga explícitamente, este item se publica bajo la siguiente descripción: Creative Commons Attribution-NonCommercial-ShareAlike 2.5 Unported (CC BY-NC-SA 2.5)
Identificadores
URI: http://hdl.handle.net/11336/132286
DOI: https://doi.org/10.1016/B978-0-12-818130-0.00004-0
URL: https://www.sciencedirect.com/science/article/pii/B9780128181300000040
Colecciones
Capítulos de libros(CIFASIS)
Capítulos de libros de CENTRO INT.FRANCO ARG.D/CS D/L/INF.Y SISTEM.
Citación
Sad, Gonzalo Daniel; Terissi, Lucas Daniel; Gómez, Juan Carlos; Disambiguating Conflicting Classification Results in AVSR; Elsevier; 2019; 55-80
Compartir
Altmétricas
 

Enviar por e-mail
Separar cada destinatario (hasta 5) con punto y coma.
  • Facebook
  • X Conicet Digital
  • Instagram
  • YouTube
  • Sound Cloud
  • LinkedIn

Los contenidos del CONICET están licenciados bajo Creative Commons Reconocimiento 2.5 Argentina License

https://www.conicet.gov.ar/ - CONICET

Inicio

Explorar

  • Autores
  • Disciplinas
  • Comunidades

Estadísticas

Novedades

  • Noticias
  • Boletines

Ayuda

Acerca de

  • CONICET Digital
  • Equipo
  • Red Federal

Contacto

Godoy Cruz 2290 (C1425FQB) CABA – República Argentina – Tel: +5411 4899-5400 repositorio@conicet.gov.ar
TÉRMINOS Y CONDICIONES