Repositorio Institucional
Repositorio Institucional
CONICET Digital
  • Inicio
  • EXPLORAR
    • AUTORES
    • DISCIPLINAS
    • COMUNIDADES
  • Estadísticas
  • Novedades
    • Noticias
    • Boletines
  • Ayuda
    • General
    • Datos de investigación
  • Acerca de
    • CONICET Digital
    • Equipo
    • Red Federal
  • Contacto
JavaScript is disabled for your browser. Some features of this site may not work without it.
  • INFORMACIÓN GENERAL
  • RESUMEN
  • ESTADISTICAS
 
Artículo

Procesamiento de Lenguaje Natural aplicado a las ciencias sociales: Detección de tópicos en letras de tango

Título: Natural Language Processing applied to Social Sciences: Topic identification in tango lyrics
Rosati, Germán FedericoIcon
Fecha de publicación: 04/2022
Editorial: Centro de Investigaciones y Estudios Sociológicos
Revista: Revista Latinoamericana de Metodología de la Investigación Social
e-ISSN: 1853-6190
Idioma: Español
Tipo de recurso: Artículo publicado
Clasificación temática:
Otras Sociología

Resumen

 
En este artículo, se presenta una aplicación de una técnica de Procesamiento de Lenguaje Natural (modelado de tópicos) sobre un corpus de letras de tango. Introduce un flujo de trabajo posible para el análisis textual computacional y en una técnica específica para la detección de tópicos: Latent Dirichlet Allocation (LDA). Se trabajará sobre un corpus de 5.617 letras buscando detectar de forma semiautomática sus temas. Los tópicos detectados abarcan desde imágenes de la ciudad, sobre el tango mismo, sobre emociones negativas y positivas, etc. Se analiza su evolución temporal y se muestra el cambio relativo de los tópicos en las letras de tango. También se valida el modelo analizando la composición de tópicos de algunos tangos canónicos. El trabajo busca ilustrar las potencialidades que estas técnicas tienen para el análisis de datos textuales en ciencias sociales: su escalabilidad y sus posibilidades de replicabilidad. Se marcan, finalmente, algunas limitaciones de este enfoque.
 
This article presents the application of topic modeling, a natural language processing technique, in the context of tango lyrics analysis. It introduces a general workflow for computational text analysis and a specific topic detection technique: Latent Dirichlet Allocation (LDA). A semi-automated topic detection analysis of a 5,617 song corpus is described, finding a variety of recurring themes including urban imagery, tango itself, negative and positive emotions, etc. Further temporal analysis evidences the ebb and flow of topics in tango lyrics. The detection model is validated by examining the topic composition found in canonical song examples. This work aims to highlight the potential of these techniques for text data analysis in the social sciences, their scalability and replicability. Some limitations of this approach are also discussed.
 
Palabras clave: TOPIC MODELING , PROCESAMIENTO DE LENGUAJE NATURAL , TANGO , CIENCIAS SOCIALES COMPUTACIONALES
Ver el registro completo
 
Archivos asociados
Thumbnail
 
Tamaño: 2.980Mb
Formato: PDF
.
Descargar
Licencia
info:eu-repo/semantics/openAccess Excepto donde se diga explícitamente, este item se publica bajo la siguiente descripción: Creative Commons Attribution-NonCommercial-ShareAlike 2.5 Unported (CC BY-NC-SA 2.5)
Identificadores
URI: http://hdl.handle.net/11336/187219
URL: http://relmis.com.ar/ojs/index.php/relmis/article/view/procesamiento_lenguaje_na
Colecciones
Articulos(SEDE CENTRAL)
Articulos de SEDE CENTRAL
Citación
Rosati, Germán Federico; Procesamiento de Lenguaje Natural aplicado a las ciencias sociales: Detección de tópicos en letras de tango; Centro de Investigaciones y Estudios Sociológicos; Revista Latinoamericana de Metodología de la Investigación Social; 12; 23; 4-2022; 38-60
Compartir

Enviar por e-mail
Separar cada destinatario (hasta 5) con punto y coma.
  • Facebook
  • X Conicet Digital
  • Instagram
  • YouTube
  • Sound Cloud
  • LinkedIn

Los contenidos del CONICET están licenciados bajo Creative Commons Reconocimiento 2.5 Argentina License

https://www.conicet.gov.ar/ - CONICET

Inicio

Explorar

  • Autores
  • Disciplinas
  • Comunidades

Estadísticas

Novedades

  • Noticias
  • Boletines

Ayuda

Acerca de

  • CONICET Digital
  • Equipo
  • Red Federal

Contacto

Godoy Cruz 2290 (C1425FQB) CABA – República Argentina – Tel: +5411 4899-5400 repositorio@conicet.gov.ar
TÉRMINOS Y CONDICIONES