Mejoras en Técnicas de Selección de Variables Usando RFE

Izetta Riera, Carlos Javier

Mostrar el registro sencillo del ítem

dc.contributor

Granitto, Pablo Miguel Se ha confirmado la validez de este valor de autoridad por un usuario

dc.contributor.author

Izetta Riera, Carlos Javier Se ha confirmado la validez de este valor de autoridad por un usuario

dc.date.available

2019-08-09T17:22:57Z

dc.date.issued

2017-10-27

dc.identifier.citation

Izetta Riera, Carlos Javier; Granitto, Pablo Miguel; Mejoras en Técnicas de Selección de Variables Usando RFE; 27-10-2017

dc.identifier.uri

http://hdl.handle.net/11336/81315

dc.description.abstract

La clasificación automática de ejemplos es una de las principales tareas del Aprendizaje Automatizado. Consiste en determinar, en base a un conjunto de datos dados, una función que permita asignar la pertenencia a cierta clase a ejemplos no clasificados aún. A menudo la representación de estos datos implica utilizar muchos atributos ovariables y sólo algunas de ellas son relevantes para el problema de clasificación en estudio. Las variables irrelevantes degradan el rendimiento de los métodos de clasificación, tanto en velocidad (debido a la alta dimensionalidad) como en la precisión predictiva (debido a la información irrelevante). Esta situación hace que las técnicas de selección de variables sean de importancia a la hora de aumentar el poder de representación. Para muchos problemas del mundo real las variables relevantes son desconocidas y posiblemente impliquen mucha interacción entre ellas, necesitamos métodos fiables y eficaces para eliminar la mayoría de las variables irrelevantes y así quedarnos con unpequeño subconjunto de variables candidatas que, idealmente, es necesario y suficiente para describir el problema.Muchos esfuerzos se concentran actualmente en desarrollar métodos de selección de variables que sean eficientes computacionalmente, estables ante cambios mínimos en los datos y resistentes al fenómeno de sobreajuste. En particular, Guyon y colaboradores introdujeron el método RFE (Recursive Feature Elimination) para selección de variablesen problemas de expresión génica. El método ha despertado un gran interés, ya que proporciona una gran performance con un relativamente bajo costo computacional. El objetivo general de esta tesis fue el desarrollo de nuevas técnicas de selección de variables basadas en el método RFE para la solución de típicos problemas de clasificación binaria y multiclase. Estas nuevas técnicas fueron ampliamente evaluadas y aplicadas sobre problemas artificiales y al análisis de datos de amplio interés actual en bioinformática, chemoinformática, control de calidad en productos agroindustriales y problemas reales de gran interés científico-tecnológico, obteniéndose resultados promisorios al ser comparadas contra otros métodos del estado del arte.

dc.description.abstract

Automatic classi cation is one of the main tasks in Machine Learning. It consists in assign one of a set of categories to new observation, on the basis of a training set of data. Often the data involves many features and only a few of them are relevant to the classi cation problem. The irrelevant features degrades the performance of classi cation methods, both in speed (due to the high dimensionality) and in predictive accuracy (due to the irrelevant information). Feature selection is an important technique in order to increase representation power. In many real-world problems the relevant features are unknown and may involve a lot of interaction among them. We need reliable and e ective methods to eliminate most irrelevant feature and obtain a good subset of features with high predictive power. Many feature selection methods have been developed over the last years. Particularly, Guyon et. al. introduced the well-known SVM-RFE (Support Vector Machine-Recursive Feature Elimination) method for gene selection. It has been widely applied in analyzing high-dimensional biological data, such as gene expression data and provides good performance with moderate computational e orts. In the present tesis, we propose extensions of SVM-RFE to solve both typical binary and multiclass problems. First, we demonstrate the e ciency of this extensions using arti cial datasets and evaluate the accuracy using several real.world datasets, comparing the results with the selections made with state of the art methods.

dc.format

application/pdf

dc.language.iso

spa

dc.rights

info:eu-repo/semantics/restrictedAccess

dc.rights.uri

https://creativecommons.org/licenses/by-nc-sa/2.5/ar/

dc.subject

Selección de Variables

dc.subject

Eliminación Recursiva de Variables

dc.subject

Aprendizaje Automático

dc.subject

Combinación de Listas

dc.subject.classification

Ciencias de la Computación Se ha confirmado la validez de este valor de autoridad por un usuario

dc.subject.classification

Ciencias de la Computación e Información Se ha confirmado la validez de este valor de autoridad por un usuario

dc.subject.classification

CIENCIAS NATURALES Y EXACTAS Se ha confirmado la validez de este valor de autoridad por un usuario

dc.title

Mejoras en Técnicas de Selección de Variables Usando RFE

dc.type

info:eu-repo/semantics/doctoralThesis

dc.type

info:eu-repo/semantics/publishedVersion

dc.type

info:ar-repo/semantics/tesis doctoral

dc.date.updated

2019-07-31T18:47:53Z

dc.description.fil

Fil: Izetta Riera, Carlos Javier. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Rosario. Centro Internacional Franco Argentino de Ciencias de la Información y de Sistemas. Universidad Nacional de Rosario. Centro Internacional Franco Argentino de Ciencias de la Información y de Sistemas; Argentina

dc.relation.alternativeid

info:eu-repo/semantics/altIdentifier/url/https://rephip.unr.edu.ar

dc.conicet.grado

Universitario de posgrado/doctorado Se ha confirmado la validez de este valor de autoridad por un usuario

dc.conicet.titulo

Doctor en Informática

dc.conicet.rol

Autor

dc.conicet.rol

Director

dc.conicet.otorgante

Universidad Nacional de Rosario. Facultad de Ciencias Exactas, Ingeniería y Agrimensura Se ha confirmado la validez de este valor de autoridad por un usuario

Archivos asociados

Tamaño: 7.528Mb

Formato: PDF

Solicitar