Mostrar el registro sencillo del ítem
dc.contributor.author
Rosati, Germán Federico
dc.date.available
2023-02-07T16:57:37Z
dc.date.issued
2022-04
dc.identifier.citation
Rosati, Germán Federico; Procesamiento de Lenguaje Natural aplicado a las ciencias sociales: Detección de tópicos en letras de tango; Centro de Investigaciones y Estudios Sociológicos; Revista Latinoamericana de Metodología de la Investigación Social; 12; 23; 4-2022; 38-60
dc.identifier.uri
http://hdl.handle.net/11336/187219
dc.description.abstract
En este artículo, se presenta una aplicación de una técnica de Procesamiento de Lenguaje Natural (modelado de tópicos) sobre un corpus de letras de tango. Introduce un flujo de trabajo posible para el análisis textual computacional y en una técnica específica para la detección de tópicos: Latent Dirichlet Allocation (LDA). Se trabajará sobre un corpus de 5.617 letras buscando detectar de forma semiautomática sus temas. Los tópicos detectados abarcan desde imágenes de la ciudad, sobre el tango mismo, sobre emociones negativas y positivas, etc. Se analiza su evolución temporal y se muestra el cambio relativo de los tópicos en las letras de tango. También se valida el modelo analizando la composición de tópicos de algunos tangos canónicos. El trabajo busca ilustrar las potencialidades que estas técnicas tienen para el análisis de datos textuales en ciencias sociales: su escalabilidad y sus posibilidades de replicabilidad. Se marcan, finalmente, algunas limitaciones de este enfoque.
dc.description.abstract
This article presents the application of topic modeling, a natural language processing technique, in the context of tango lyrics analysis. It introduces a general workflow for computational text analysis and a specific topic detection technique: Latent Dirichlet Allocation (LDA). A semi-automated topic detection analysis of a 5,617 song corpus is described, finding a variety of recurring themes including urban imagery, tango itself, negative and positive emotions, etc. Further temporal analysis evidences the ebb and flow of topics in tango lyrics. The detection model is validated by examining the topic composition found in canonical song examples. This work aims to highlight the potential of these techniques for text data analysis in the social sciences, their scalability and replicability. Some limitations of this approach are also discussed.
dc.format
application/pdf
dc.language.iso
spa
dc.publisher
Centro de Investigaciones y Estudios Sociológicos
dc.rights
info:eu-repo/semantics/openAccess
dc.rights.uri
https://creativecommons.org/licenses/by-nc-sa/2.5/ar/
dc.subject
TOPIC MODELING
dc.subject
PROCESAMIENTO DE LENGUAJE NATURAL
dc.subject
TANGO
dc.subject
CIENCIAS SOCIALES COMPUTACIONALES
dc.subject.classification
Otras Sociología
dc.subject.classification
Sociología
dc.subject.classification
CIENCIAS SOCIALES
dc.title
Procesamiento de Lenguaje Natural aplicado a las ciencias sociales: Detección de tópicos en letras de tango
dc.title
Natural Language Processing applied to Social Sciences: Topic identification in tango lyrics
dc.type
info:eu-repo/semantics/article
dc.type
info:ar-repo/semantics/artículo
dc.type
info:eu-repo/semantics/publishedVersion
dc.date.updated
2023-02-07T10:18:43Z
dc.identifier.eissn
1853-6190
dc.journal.volume
12
dc.journal.number
23
dc.journal.pagination
38-60
dc.journal.pais
Argentina
dc.journal.ciudad
Ciudad Autónoma de Buenos Aires
dc.description.fil
Fil: Rosati, Germán Federico. Universidad Nacional de San Martín. Instituto de Altos Estudios Sociales; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas; Argentina. Consejo Latinoamericano de Ciencias Sociales. Prog.de Invest.s/el Movimiento de la Soc.arg.; Argentina
dc.journal.title
Revista Latinoamericana de Metodología de la Investigación Social
dc.relation.alternativeid
info:eu-repo/semantics/altIdentifier/url/http://relmis.com.ar/ojs/index.php/relmis/article/view/procesamiento_lenguaje_natural/217
Archivos asociados