Artículo
En este artículo, se presenta una aplicación de una técnica de Procesamiento de Lenguaje Natural (modelado de tópicos) sobre un corpus de letras de tango. Introduce un flujo de trabajo posible para el análisis textual computacional y en una técnica específica para la detección de tópicos: Latent Dirichlet Allocation (LDA). Se trabajará sobre un corpus de 5.617 letras buscando detectar de forma semiautomática sus temas. Los tópicos detectados abarcan desde imágenes de la ciudad, sobre el tango mismo, sobre emociones negativas y positivas, etc. Se analiza su evolución temporal y se muestra el cambio relativo de los tópicos en las letras de tango. También se valida el modelo analizando la composición de tópicos de algunos tangos canónicos. El trabajo busca ilustrar las potencialidades que estas técnicas tienen para el análisis de datos textuales en ciencias sociales: su escalabilidad y sus posibilidades de replicabilidad. Se marcan, finalmente, algunas limitaciones de este enfoque. This article presents the application of topic modeling, a natural language processing technique, in the context of tango lyrics analysis. It introduces a general workflow for computational text analysis and a specific topic detection technique: Latent Dirichlet Allocation (LDA). A semi-automated topic detection analysis of a 5,617 song corpus is described, finding a variety of recurring themes including urban imagery, tango itself, negative and positive emotions, etc. Further temporal analysis evidences the ebb and flow of topics in tango lyrics. The detection model is validated by examining the topic composition found in canonical song examples. This work aims to highlight the potential of these techniques for text data analysis in the social sciences, their scalability and replicability. Some limitations of this approach are also discussed.
Procesamiento de Lenguaje Natural aplicado a las ciencias sociales: Detección de tópicos en letras de tango
Título:
Natural Language Processing applied to Social Sciences: Topic identification in tango lyrics
Fecha de publicación:
04/2022
Editorial:
Centro de Investigaciones y Estudios Sociológicos
Revista:
Revista Latinoamericana de Metodología de la Investigación Social
e-ISSN:
1853-6190
Idioma:
Español
Tipo de recurso:
Artículo publicado
Clasificación temática:
Resumen
Archivos asociados
Licencia
Identificadores
Colecciones
Articulos(SEDE CENTRAL)
Articulos de SEDE CENTRAL
Articulos de SEDE CENTRAL
Citación
Rosati, Germán Federico; Procesamiento de Lenguaje Natural aplicado a las ciencias sociales: Detección de tópicos en letras de tango; Centro de Investigaciones y Estudios Sociológicos; Revista Latinoamericana de Metodología de la Investigación Social; 12; 23; 4-2022; 38-60
Compartir