Libro
Modelos estadísticos en lenguaje R
Garibaldi, Lucas Alejandro
; Oddi, Facundo José
; Azuaga, Gonzalo Daniel; Behnisch, Aliosha Nicolás
; Aristimuño, Francisco Javier
Fecha de publicación:
2023
Editorial:
Universidad Nacional de Río Negro
ISBN:
978-987-8258-14-0
Idioma:
Español
Clasificación temática:
Resumen
Los profesionales de las ciencias económicas y ambientales deben resolver problemas a partir de la colección y el análisis de datos. En general, estos datos son tomados de una muestra procedente de relevamientos o experimentos, es decir que la información con la que trabajan es parcial. Por lo tanto, deben contar con herramientas que los ayuden a tomar la mejor decisión ante preguntas que tienen respuestas inciertas. La estadística aporta las herramientas necesarias para colectar los datos, a la vez que permite resumir y presentar la información contenida en la muestra, para luego inferir en base a ella características fundamentales de la población de la que fue extraída. Además, posibilita cuantificar la incertidumbre asociada a nuestras respuestas o, dicho de otra manera, la probabilidad de equivocarnos en la decisión tomada. Por lo tanto, al utilizar la estadística, las conclusiones estarán sustentadas por un sólido marco de análisis. A lo largo de los capítulos ponemos a disposición ejercicios prácticos para adquirir conocimientos y aptitudes sobre cómo colectar datos (diseño de estudios), modelarlos y analizarlos utilizando el programa R. Suponemos que el lector ya ha realizado algún curso introductorio de estadística y está familiarizado con los conceptos básicos de estadística y probabilidad. Los ejercicios se presentan con la intención de proporcionar al lector un marco similar al que un profesional se enfrentaría comúnmente en su ámbito de trabajo. Esto es, con un marco conceptual del que deriva un problema relacionado, y para el cual el lector es guiado hacia su resolución (analizar cómo ha sido la colección de los datos, explorarlos, plantear modelos interesantes, determinar si el modelo planteado es adecuado, plantear modelos alternativos, realizar inferencias y predicciones). Un aspecto relevante es que los ejercicios están basados en datos reales (datos publicados en sitios web, o cedidos por colegas). Recomendamos seguir los capítulos frente a una computadora analizando los datos reales que se encuentran disponibles en el siguiente enlace: http://editorial.unrn.edu.ar/descargas/lenguaje_r_datos_eunrn.zip. Limitándonos al estudio de modelos con una sola variable de respuesta (dependiente), la obra se organiza en ocho capítulos. Los primeros siete abarcan el modelado de datos con distribución normal. En el capítulo 1 se estudia el modelo de regresión lineal entre dos variables cuantitativas (regresión lineal simple) y se introducen los conceptos de criterio de mínimos cuadrados ordinarios para la estimación de parámetros, bondad de ajuste y validez de los modelos a partir de sus supuestos. Los capítulos 2 y 3 tratan con variables independientes categóricas, el análisis de la varianza (ANOVA) y los test a posteriori (comparaciones múltiples). En particular, se aborda el diseño completamente aleatorizado (DCA), y se introduce el modelado con más de una variable independiente, todas categóricas en este caso, a partir del diseño en bloques completamente aleatorizados (DBCA) y el diseño multifactorial. El capítulo 4 trata con más de una variable independiente, pero en este caso, cuantitativas (regresión lineal múltiple) e introduce un aspecto fundamental del modelado estadístico: la multicolinearidad. Para ello, en este capítulo se estudian las sumas de cuadrados parciales (ANOVA tipo III) y secuenciales (ANOVA tipo I). En el capítulo 5 se formaliza el concepto de modelo lineal general y se plantean problemas que tratan con variables independientes cuantitativas y categóricas de manera conjunta. Se introducen, además, los conceptos de verosimilitud y los distintos criterios de información (AIC, BIC, etcétera) como medidas de bondad de ajuste, y el criterio de máxima verosimilitud como método de estimación de parámetros. Al llegar al capítulo 6, se incorpora el modelado de la varianza flexibilizando la homocedasticidad, uno de los supuestos del modelo lineal. Por su parte, el capítulo 7 cubre conceptos detrás del modelado de relaciones no lineales. Finalmente, en el capítulo 8 se flexibiliza el supuesto de normalidad para modelar datos no normales. Este es el campo de los modelos lineales generalizados que permiten tratar con distribuciones de la familia exponencial: binomial, Poisson, normal y Gamma, y también se abarca la distribución binomial negativa. En forma general, a través de la obra presentamos el marco de inferencia frecuentista y de inferencia multimodelo. Los capítulos no desarrollan los conceptos teóricos. Para ello, sugerimos la lectura de diversos libros de texto que abordan los conceptos presentes en esta obra de manera exhaustiva. Esta obra es fruto de varios años de llevar adelante cursos de grado y posgrado en la Universidad Nacional de Río Negro. En esta segunda edición, hemos incluido ejercicios complementarios, una tipografía orientada a la programación que facilita la legibilidad de códigos y salidas, mejoramos el formato de las ecuaciones, y hemos incluido nuevas bases de datos de la Encuesta Permanente de Hogares, entre otras mejoras. Esperamos que el libro les resulte útil para el abordaje de sus propios análisis o la interpretación de análisis presentados por otros.
Archivos asociados
Licencia
Identificadores
Colecciones
Libros (IRNAD)
Libros de INSTITUTO DE INVESTIGACIONES EN RECURSOS NATURALES, AGROECOLOGIA Y DESARROLLO RURAL
Libros de INSTITUTO DE INVESTIGACIONES EN RECURSOS NATURALES, AGROECOLOGIA Y DESARROLLO RURAL
Citación
Garibaldi, Lucas Alejandro; Oddi, Facundo José; Azuaga, Gonzalo Daniel; Behnisch, Aliosha Nicolás; Aristimuño, Francisco Javier; Modelos estadísticos en lenguaje R; Universidad Nacional de Río Negro; 2023; 282
Compartir