Repositorio Institucional
Repositorio Institucional
CONICET Digital
  • Inicio
  • EXPLORAR
    • AUTORES
    • DISCIPLINAS
    • COMUNIDADES
  • Estadísticas
  • Novedades
    • Noticias
    • Boletines
  • Ayuda
    • General
    • Datos de investigación
  • Acerca de
    • CONICET Digital
    • Equipo
    • Red Federal
  • Contacto
JavaScript is disabled for your browser. Some features of this site may not work without it.
  • METADATOS
  • CONDICIONES DE USO
  • ARCHIVOS
  • ITEMS RELACIONADOS
  • ESTADISTICAS
 
 
Datos de investigación

Epa-DB: a database for the development of pronunciation scoring systems

Autores: Vidal Dominguez, JazminIcon ; Ferrer, LucianaIcon
Colaboradores: Brambilla, Leonardo Miguel
Publicador: Consejo Nacional de Investigaciones Científicas y Técnicas
Fecha de depósito: 26/01/2022
Fecha de actualizado: 01/08/2019-24/01/2022
Clasificación temática:
Telecomunicaciones; Ciencias de la Computación; Estudios Generales del Lenguaje

Resumen

Epa-DB es una base de datos diseñada para el desarrollo y evaluación de sistemas de calificación de la pronunciación. Contiene 3200 frases fonéticamente balanceadas en idioma inglés de hablantes argentinos en proceso de aprendizaje.Cada frase está anotada a nivel alófono por dos anotadores expertos. Las frases fueron grabadas en las computadoras de los participantes para imitar el entorno de uso esperable para los sistemas que se desea desarrollar.

Otro

Epa-DB es una base de datos diseñada para el desarrollo y evaluación de sistemas de calificación de la pronunciación. Contiene 3200 frases fonéticamente balanceadas en idioma inglés de hablantes argentinos en proceso de aprendizaje.
Palabras clave: Pronunciacion, Ingles no nativo, Habla
Alcance geográfico
.

Alcance geográfico

.
Identificador del recurso
URI: http://hdl.handle.net/11336/150678
Colecciones
Datos de Investigación(ICC)
Datos de Investigación de INSTITUTO DE INVESTIGACION EN CIENCIAS DE LA COMPUTACION
Citación
Vidal Dominguez, Jazmin; Ferrer, Luciana; (2022): Epa-DB: a database for the development of pronunciation scoring systems. Consejo Nacional de Investigaciones Científicas y Técnicas. (dataset). http://hdl.handle.net/11336/150678
Condiciones de uso
Las buenas prácticas científicas esperan que se otorgue el crédito adecuado mediante una citación. Utilice un formato de citación y aplique estas normas de reutilización.
Puede compartir (copiar, distribuir y usar); crear (generar nuevas obras basadas en los datos) y adaptar (modificar, transformar) atribuyendo cualquier uso público de los datos, o trabajos producidos a partir de los mismos, debe mostrar la licencia de los datos y mantener intactos los avisos del conjunto de datos original.
Compartir
Archivos del conjunto de datos
Archivo
Notas de uso
Tamaño
 
EpaDB - Paper.pdf
Publicación de la base de datos. Contiene una descripción general de la misma.  Más
232.9Kb
  Descarga
readme.md
Archivo descriptivo de la base de datos en general y de cada tipo de archivo en particular. Explica como utilizar los archivos de código de la base de datos.  Más
3.729Kb
  Descarga
run.sh
Archivo de código escrito en Bash que se utiliza para generar las etiquetas (puntuaciones positivas y negativas) que se guardan en la carpeta llamada 'labels'. Se utiliza llamando el comando './run.sh' desde la terminal de una computadora. Este archivo llama al archivo de código Python llamado assign_references.py.  Más
258bytes
  Descarga
reference_transcriptions.txt
Archivo de pronunciaciones para cada frase de la base de datos. Por cada frase se considera un conjunto de pronunciaciones correctas en inglés americano. El archivo está escrito en ARPAbet, un alfabeto fonético amigable para las computadoras y de uso frecuente en el área.  Más
7.755Kb
  Descarga
assign_reference.py
Archivo de código Python que se utiliza para calcular las etiquetas de la base de datos que se encuentran en la carpeta 'labels'. Es llamado por el archivo de código Bash al correr el comando './run.sh'. Al ser ejecutado, lee las distintas pronunciaciones de referencia del archivo 'reference_transcriptions.txt' y las anotaciones manuales de la carpeta 'annotations' y las alinea. Una vez alineadas compara cada elemento de la transcripción con su correspondiente anotación manual. Si coinciden, asigna una etiqueta positiva. Si no coinciden, asigna una etiqueta negativa. Los resultados se guardan por hablante en la carpeta 'labels'.  Más
6.111Kb
  Descarga
waveforms.zip
Archivos de audio en format '.wav' con calidad de 44khz. Los archivos están organizados por hablante. Cada hablante lee 64 frases cortas en inglés, fonéticamente balanceadas y diseñadas para contener sonidos difíciles de pronunciar para estudiantes de inglés provenientes de Argentina. Hay un total de 50 hablantes.  Más
547.0Mb
  Descarga
transcriptions.zip
Archivos de transcripciones organizados por hablante en formato '.lab', similar a formato '.txt'. Se trata de las transcripciones ortográficas de las frases pronunciadas por los hablantes. Son 64 frases cortas por hablante en idioma inglés, foneticamente balanceadas y diseñadas para contener sonidos difíciles de pronunciar para argentinos hablando en inglés.  Más
1001.Kb
  Descarga
labels.zip
Archivos de etiquetas positivas y negativas organizadas por hablante en formato '.txt'. Para cada frase de cada hablante se tiene un archivo que contiene la transcripción de referencia (lo que el hablante debería haber pronunciado) y la anotación manual (lo que el hablante efectivamente pronunció) junto con una etiqueta que es positiva (+) si las dos cosas coinciden y negativa (-) si no.  Más
1.061Mb
  Descarga
annotations.zip
Archivos de anotaciones manuales organizados por hablante en formato '.TextGrid'. Este formato es estándar en fonética, fonología y procesamiento del habla y se puede procesar utilizando el programa de código abierto Praat. Hay un archivo para cada frase pronunciada por cada hablante. Los archivos contienen alineamientos temporales de cada frase a nivel palabra y fonema y para cada fonema lo que el hablante pronunció en alfabeto fonetico ARPAbet.  Más
13.77Mb
  Descarga
 
 
Descargar todo
  Descargar solo metadatos (JSON)   Descargar solo metadatos (XML)
 
Preparando la descarga
 

Ver el registro completo

Publicaciones relacionadas

  • EpaDB: A Database for Development of Pronunciation Assessment Systems

Enviar por e-mail
Separar cada destinatario (hasta 5) con punto y coma.
  • Facebook
  • X Conicet Digital
  • Instagram
  • YouTube
  • Sound Cloud
  • LinkedIn

Los contenidos del CONICET están licenciados bajo Creative Commons Reconocimiento 2.5 Argentina License

https://www.conicet.gov.ar/ - CONICET

Inicio

Explorar

  • Autores
  • Disciplinas
  • Comunidades

Estadísticas

Novedades

  • Noticias
  • Boletines

Ayuda

Acerca de

  • CONICET Digital
  • Equipo
  • Red Federal

Contacto

Godoy Cruz 2290 (C1425FQB) CABA – República Argentina – Tel: +5411 4899-5400 repositorio@conicet.gov.ar
TÉRMINOS Y CONDICIONES