EpaDB - Paper.pdf
Publicación de la base de datos. Contiene una descripción general de la misma.
Más
232.9Kb
readme.md
Archivo descriptivo de la base de datos en general y de cada tipo de archivo en particular. Explica como utilizar los archivos de código de la base de datos.
Más
3.729Kb
run.sh
Archivo de código escrito en Bash que se utiliza para generar las etiquetas (puntuaciones positivas y negativas) que se guardan en la carpeta llamada 'labels'. Se utiliza llamando el comando './run.sh' desde la terminal de una computadora. Este archivo llama al archivo de código Python llamado assign_references.py.
Más
258bytes
reference_transcriptions.txt
Archivo de pronunciaciones para cada frase de la base de datos. Por cada frase se considera un conjunto de pronunciaciones correctas en inglés americano. El archivo está escrito en ARPAbet, un alfabeto fonético amigable para las computadoras y de uso frecuente en el área.
Más
7.755Kb
assign_reference.py
Archivo de código Python que se utiliza para calcular las etiquetas de la base de datos que se encuentran en la carpeta 'labels'. Es llamado por el archivo de código Bash al correr el comando './run.sh'. Al ser ejecutado, lee las distintas pronunciaciones de referencia del archivo 'reference_transcriptions.txt' y las anotaciones manuales de la carpeta 'annotations' y las alinea. Una vez alineadas compara cada elemento de la transcripción con su correspondiente anotación manual. Si coinciden, asigna una etiqueta positiva. Si no coinciden, asigna una etiqueta negativa. Los resultados se guardan por hablante en la carpeta 'labels'.
Más
6.111Kb
waveforms.zip
Archivos de audio en format '.wav' con calidad de 44khz. Los archivos están organizados por hablante. Cada hablante lee 64 frases cortas en inglés, fonéticamente balanceadas y diseñadas para contener sonidos difíciles de pronunciar para estudiantes de inglés provenientes de Argentina. Hay un total de 50 hablantes.
Más
547.0Mb
transcriptions.zip
Archivos de transcripciones organizados por hablante en formato '.lab', similar a formato '.txt'. Se trata de las transcripciones ortográficas de las frases pronunciadas por los hablantes. Son 64 frases cortas por hablante en idioma inglés, foneticamente balanceadas y diseñadas para contener sonidos difíciles de pronunciar para argentinos hablando en inglés.
Más
1001.Kb
labels.zip
Archivos de etiquetas positivas y negativas organizadas por hablante en formato '.txt'. Para cada frase de cada hablante se tiene un archivo que contiene la transcripción de referencia (lo que el hablante debería haber pronunciado) y la anotación manual (lo que el hablante efectivamente pronunció) junto con una etiqueta que es positiva (+) si las dos cosas coinciden y negativa (-) si no.
Más
1.061Mb
annotations.zip
Archivos de anotaciones manuales organizados por hablante en formato '.TextGrid'. Este formato es estándar en fonética, fonología y procesamiento del habla y se puede procesar utilizando el programa de código abierto Praat. Hay un archivo para cada frase pronunciada por cada hablante. Los archivos contienen alineamientos temporales de cada frase a nivel palabra y fonema y para cada fonema lo que el hablante pronunció en alfabeto fonetico ARPAbet.
Más
13.77Mb