Artículo
The task of automated recognition of handwritten texts requires various phases and technologies both optical and language related. This article describes an approach for performing this task in a comprehensive manner, using machine learning throughout all phases of the process. In addition to the explanation of the employed methodology, it describes the process of building and evaluating a model of manuscript recognition for the Spanish language. The original contribution of this article is given by the training and evaluation of Offline HTR models for Spanish language manuscripts, as well as the evaluation of a platform to perform this task in a complete way. In addition, it details the work being carried out to achieve improvements in the models obtained, and to develop new models for different complex corpora that are more difficult for the HTR task. La tarea del reconocimiento automatizado de textos manuscritos requiere de diversas fases y tecnologías tanto ópticas como del lenguaje. En este artículo se describe un enfoque para la realización de esta tarea de forma completa, mediante el empleo de aprendizaje automatizado a lo largo de todas las fases del proceso. Además de explicar la metodología empleada, se describe el proceso de construcción y evaluación de un modelo de reconocimiento de manuscritos para el lenguaje español. La contribución original de este artículo está dada por el entrenamiento y evaluación de modelos de Offline HTR para manuscritos en español, así como la evaluación de una plataforma para la realización de esta tarea de forma completa. Además, se detallan los trabajos que se están llevando a cabo para lograr mejoras en los modelos obtenidos, y desarrollar nuevos modelos para distintos corpus de lectura compleja.
End-to-end platform evaluation for Spanish Handwritten Text Recognition
Título:
Evaluación de una plataforma completa para Reconocimiento de Textos Manuscritos en Español
Fecha de publicación:
12/2021
Editorial:
Universidad de Palermo. Facultad de Ingeniería
Revista:
Ciencia y Tecnología
ISSN:
1850-0870
e-ISSN:
2344-9217
Idioma:
Inglés
Tipo de recurso:
Artículo publicado
Clasificación temática:
Resumen
Archivos asociados
Licencia
Identificadores
Colecciones
Articulos(ICSOH)
Articulos de INST.DE INVEST. EN CS. SOC. Y HUMANIDADES
Articulos de INST.DE INVEST. EN CS. SOC. Y HUMANIDADES
Citación
Xamena, Eduardo; Barboza, Héctor Emanuel; Orozco, Carlos Ismael; End-to-end platform evaluation for Spanish Handwritten Text Recognition; Universidad de Palermo. Facultad de Ingeniería; Ciencia y Tecnología; 2021; 12-2021; 81-95
Compartir
Altmétricas