Mostrar el registro sencillo del ítem

dc.contributor.author
Rosati, Germán Federico  
dc.date.available
2022-08-18T13:55:37Z  
dc.date.issued
2021-06  
dc.identifier.citation
Rosati, Germán Federico; Métodos de Machine Learning como alternativa para la imputación de datos perdidos: Un ejercicio en base a la Encuesta Permanente de Hogares; Asociación Argentina de Especialistas en Estudios del Trabajo; Estudios del Trabajo; 61; 6-2021; 1-23  
dc.identifier.issn
0327-5744  
dc.identifier.uri
http://hdl.handle.net/11336/165980  
dc.description.abstract
La presente ponencia expone algunos avances en la construcción de un modelo de imputación de valores perdidos y sin respuesta para las variables de ingreso en encuestas a hogares. Se presentan los resultados de algunos experimentos de imputación de los ingresos correspondientes a la ocupación principal de la Encuesta Permanente de Hogares, basados en técnicas de Ensamble Learning y Deep Learning: Random Forest, XGBoost y Multi-Layer Perceptron. Se compara la performance de estas técnicas con el método Hot Deck (uno de los métodos usados por el Sistema Estadístico Nacional).En la primera y segunda parte del documento plantea el problema de forma más específica y se pasa revista a los principales mecanismos de generación de los valores perdidos y sus consecuencias al momento de la imputación de valores perdidos. En la tercera parte, se presentan las técnicas propuestas y sus fundamentos teóricos-metodológicos. Finalmente, en la cuarta sección, se presentan los principales resultados de la aplicación de los métodos propuestos sobre datos de la Encuesta Permanente de Hogares.  
dc.description.abstract
This paper presents some advances in the construction of a model for the imputation of missing values and no response for the income variables in household surveys. The results of some imputation experiments of the labor income variable of the Permanent Household Survey are presented, based on Assembly Learning and Deep Learning techniques: Random Forest, XGBoost and Multi-Layer Perceptron. The performance of these techniques is compared with the Hot Deck method (one of the methods used by the National Statistical System). In the first and second part of the document, it raises the problem more specifically and reviews the main mechanisms for generating lost values and their consequences at the time of imputation of lost values. In the third part, the proposed techniques and their theoretical-methodological foundations are presented. Finally, in the fourth section, the main results of the application of the proposed methods on data from the Permanent Household Survey are presented.  
dc.format
application/pdf  
dc.language.iso
spa  
dc.publisher
Asociación Argentina de Especialistas en Estudios del Trabajo  
dc.rights
info:eu-repo/semantics/openAccess  
dc.rights.uri
https://creativecommons.org/licenses/by-nc-sa/2.5/ar/  
dc.subject
MACHINE LEARNING  
dc.subject
DATOS PERDIDOS  
dc.subject
IMPUTACION  
dc.subject
INGRESOS  
dc.subject.classification
Sociología  
dc.subject.classification
Sociología  
dc.subject.classification
CIENCIAS SOCIALES  
dc.title
Métodos de Machine Learning como alternativa para la imputación de datos perdidos: Un ejercicio en base a la Encuesta Permanente de Hogares  
dc.title
Machine Learning as alternative methods for missing data imputation: An exercise using Permanent Household Survey  
dc.type
info:eu-repo/semantics/article  
dc.type
info:ar-repo/semantics/artículo  
dc.type
info:eu-repo/semantics/publishedVersion  
dc.date.updated
2022-08-16T18:03:26Z  
dc.identifier.eissn
2545-7756  
dc.journal.number
61  
dc.journal.pagination
1-23  
dc.journal.pais
Argentina  
dc.journal.ciudad
Ciudad Autónoma de Buenos Aires  
dc.description.fil
Fil: Rosati, Germán Federico. Consejo Nacional de Investigaciones Científicas y Técnicas; Argentina. Universidad Nacional de San Martín. Instituto de Altos Estudios Sociales; Argentina. Universidad Nacional de Tres de Febrero. Departamento de Metodología, Estadística y Matemáticas; Argentina  
dc.journal.title
Estudios del Trabajo  
dc.relation.alternativeid
info:eu-repo/semantics/altIdentifier/url/https://ojs.aset.org.ar/revista/article/view/81  
dc.relation.alternativeid
info:eu-repo/semantics/altIdentifier/url/http://www.scielo.org.ar/scielo.php?script=sci_arttext&pid=S2545-77562021000100122