Evento
Comparación de diferentes modelos de GWAS para una base de datos de porotos (Phaseolus vulgaris L.).
Bortolotto, Eugenia Belén
; Angelini, Julia
; Faviere, Gabriela Soledad
; Bruno, Cecilia Ines
; Cervigni, Gerardo Domingo Lucio
Tipo del evento:
Congreso
Nombre del evento:
XIV Congreso Latinoamericano de Sociedades de Estadística “Laura Nalbarte”
Fecha del evento:
18/10/2021
Institución Organizadora:
Sociedad Uruguaya de Estadística;
Título del Libro:
XIV Congreso Latinoamericano de Sociedades de Estadística “Laura Nalbarte”: Libro de resúmenes
Editorial:
Sociedad Uruguaya de Estadística
Idioma:
Español
Clasificación temática:
Resumen
El objetivo de este trabajo fue evaluar modelos estadísticos en cuanto a su desempeño para estimar asociaciones del todo el genoma (GWAS) entre el fenotipo y genotipo. El fenotipo fue medido sobre la floración medida como día hasta la primera floración (DFF); días de floración (DTF) y días hasta la última floración (DEF). Se trabajó con un conjunto de datos compuesto por 80 cultivares de porotos genotipados con 380 marcadores moleculares del tipo SNP (Single Nucleotide Polymorphism). Los valores fenotípicos fueron previamente ajustados por un modelo lineal mixto considerando el efecto del ambiente como fijo y al efecto del cultivar e interacción de ambos como aleatorios siguiendo Nascimento et al. (2018). Previo al análisis GWAS se realizó un análisis de diversidad de los SNP, a través de métodos multivariados como Análisis de Componentes Principales y Análisis de Conglomerado (UPGMA y Bayesiano) y se buscó la matriz de estructura poblacional Q. Según el análisis UPGMA se pudo armar 7 grupos de marcadores, y según ACP esta cantidad de componentes explican el 82% de la variabilidad total de los marcadores. Los modelos comparados fueron: ANOVA: Modelo Lineal General, Modelos Lineal General con componentes principales (GLM-P), Modelos Lineal Mixto con PCA y matriz Kinship (MLM-PK), MLM comprimido (CMLM), CMLM enriquecido (ECMLM), unificación de probabilidad circulante de modelo fijo y aleatorio (FarmCPU) y Regresión por Cuantiles (QR). Los modelos comparados fueron evaluados a través de gráficos de cuantiles (Q-Q) del logaritmo de los valores p observados en función de los esperados. Si los valores p obtenidos del modelo ajustado se ubican por encima de la línea recta a 45° indica la presencia de falsos positivos, es decir marcadores moleculares cuyo valor indica que existe una asociación estadísticamente significativa entre el genotipo y el fenotipo, pero que bajo hipótesis nula no lo son. Por el contrario, si los valores p de los modelos se ubican por debajo de la línea recta, indican falsos negativos, es decir, marcadores SNP que están asociados al fenotipo pero su valor p no fue estadísticamente significativo. Si los valores p obtenidos se encuentran sobre la recta entonces indican que existen asociaciones verdaderas y polimorfismos causales. Para la corrección por multiplicidad se utilizaron dos métodos: Bonferroni y tasa de falsos descubrimientos (FDR). Basados en los gráficos Q-Q plot los modelos FarmCPU y CMLM fueron los que mejor comportamiento tuvieron respecto a los otros dado que sus curvas se ubican cercanas a la recta 1:1. En este sentido, el modelo que mayor tasa de falsos positivos presentó fue QR.
Palabras clave:
Modelos de Asociación
,
Fenotipo
,
Genotipo
,
Marcadores SNP
Archivos asociados
Licencia
Identificadores
Colecciones
Eventos (UFYMA)
Eventos de UNIDAD DE FITOPATOLOGIA Y MODELIZACION AGRICOLA
Eventos de UNIDAD DE FITOPATOLOGIA Y MODELIZACION AGRICOLA
Eventos(CEFOBI)
Eventos de CENTRO DE EST.FOTOSINTETICOS Y BIOQUIMICOS (I)
Eventos de CENTRO DE EST.FOTOSINTETICOS Y BIOQUIMICOS (I)
Citación
Comparación de diferentes modelos de GWAS para una base de datos de porotos (Phaseolus vulgaris L.).; XIV Congreso Latinoamericano de Sociedades de Estadística “Laura Nalbarte”; Montevideo; Uruguay; 2021; 12-12
Compartir