Artículo
Despite recent advances in Large Language Models in text processing, Sign Language Recognition (SLR) remains an unresolved task. This is, in part, due to limitations in the available data. In this paper, we investigate combining 1D convolutions with transformer layers to capture local features and global interactions in a low-parameter SLR model. We experimented using multiple data augmentation and regularization techniques to categorize signs of the French Belgian Sign Language. We achieved a top-1 accuracy of 42.7% and a top-10 accuracy of 81.9% in 600 different signs. This model is competitive with the current state of the art while using a significantly lower number of parameters. A pesar de los avances recientes en grandes modelos de lenguaje para el procesamiento de texto, el Reconocimiento de Lenguas de Señas (SLR por sus siglas en inglés) aun es una tarea sin resolver. Esto es, en parte, debido a las limitaciones en los datos disponibles. En este articulo, investigamos cómo combinar convoluciones 1d con capas transformer para capturar las características locales y las interacciones globales utilizando un modelo de SLR de pocos parámetros. Experimentamos usando múltiples técnicas de aumento de datos y regularización para categorizar señas de la lengua de señas belga-francesa. Como resultado, obtuvimos una exactitud top-1 de 42.7% y top-10 de 81.9% en 600 señas diferentes. Este modelo es competitivo con el estado del arte actual, utilizando una cantidad significativamente menor de parámetros.
ConvAtt Network: A Low Parameter Approach For Sign Language Recognition
Título:
Red ConvAtt: Un Acercamiento Con Bajos Parámetros Para El Reconocimiento De
Lengua De Señas
Rios, Gaston Gustavo; Dal Bianco, Pedro; Ronchetti, Franco; Quiroga, Facundo; Ponte Ahón, Santiago Ponte; Stanchi, Oscar Agustín
; Hasperué, Waldo
Fecha de publicación:
10/2024
Editorial:
Universidad Nacional de La Plata. Facultad de Informática
Revista:
Journal of Computer Science and Technology
ISSN:
1666-6046
e-ISSN:
1666-6038
Idioma:
Inglés
Tipo de recurso:
Artículo publicado
Clasificación temática:
Resumen
Archivos asociados
Licencia
Identificadores
Colecciones
Articulos(CCT - LA PLATA)
Articulos de CTRO.CIENTIFICO TECNOL.CONICET - LA PLATA
Articulos de CTRO.CIENTIFICO TECNOL.CONICET - LA PLATA
Citación
Rios, Gaston Gustavo; Dal Bianco, Pedro; Ronchetti, Franco; Quiroga, Facundo; Ponte Ahón, Santiago Ponte; et al.; ConvAtt Network: A Low Parameter Approach For Sign Language Recognition; Universidad Nacional de La Plata. Facultad de Informática; Journal of Computer Science and Technology; 24; 2; 10-2024; 104-110
Compartir
Altmétricas