Control Multimodal en Entornos Inciertos usando Aprendizaje por Refuerzos y Procesos Gaussianos

de Paula, Mariano; Avila, Luis Omar; Sánchez Reinoso, Carlos Roberto; Acosta, Gerardo Gabriel

doi:10.1016/j.riai.2015.09.004

Mostrar el registro sencillo del ítem

dc.contributor.author

de Paula, Mariano Se ha confirmado la validez de este valor de autoridad por un usuario

dc.contributor.author

Avila, Luis Omar Se ha confirmado la validez de este valor de autoridad por un usuario

dc.contributor.author

Sánchez Reinoso, Carlos Roberto Se ha confirmado la validez de este valor de autoridad por un usuario

dc.contributor.author

Acosta, Gerardo Gabriel Se ha confirmado la validez de este valor de autoridad por un usuario

dc.date.available

2016-08-03T21:00:31Z

dc.date.issued

2015-10

dc.identifier.citation

de Paula, Mariano; Avila, Luis Omar; Sánchez Reinoso, Carlos Roberto; Acosta, Gerardo Gabriel; Control Multimodal en Entornos Inciertos usando Aprendizaje por Refuerzos y Procesos Gaussianos; Elsevier; Revista Iberoamericana de Automatica E Informatica Industrial; 12; 4; 10-2015; 385-396

dc.identifier.issn

1697-7912

dc.identifier.uri

http://hdl.handle.net/11336/6896

dc.description.abstract

El control de sistemas complejos puede ser realizado descomponiendo la tarea de control en una secuencia de modos de control, o simplemente modos. Cada modo implementa una ley de retroalimentación hasta que se activa una condición de terminación, en respuesta a la ocurrencia de un evento exógeno/endógeno que indica que la ejecución del modo debe finalizar. En este trabajo se presenta una propuesta novedosa para encontrar una política de conmutación óptima para resolver el problema de control optimizando alguna medida de costo/beneficio. Una política óptima implementa un programa de control multimodal óptimo, el cual consiste en un encadenamiento de modos de control. La propuesta realizada incluye el desarrollo y formulación de un algoritmo basado en la idea de la programación dinámica integrando procesos Gaussianos y aprendizaje Bayesiano activo. Mediante el enfoque propuesto es posible realizar un uso eficiente de los datos para mejorar la exploración de las soluciones sobre espacios de estados continuos. Un caso de estudio representativo es abordado para demostrar el desempeño del algoritmo propuesto.

dc.description.abstract

The control of complex systems can be done decomposing the control task into a sequence of control modes, or modes for short. Each mode implements a parameterized feedback law until a termination condition is activated in response to the occurrence of an exogenous/endogenous event, which indicates that the execution mode must end. This paper presents a novel approach to find an optimal switching policy to solve a control problem by optimizing some measure of cost/benefit. An optimal policy implements an optimal multimodal control program, consisting in a sequence of control modes. The proposal includes the development of an algorithm based on the idea of dynamic programming integrating Gaussian processes and Bayesian active learning. In addition, an efficient use of the data to improve the exploration of the continuous state spaces solutions can be achieved through this approach. A representative case study is discussed and analyzed to demonstrate the performance of the proposed algorithm.

dc.format

application/pdf

dc.language.iso

spa

dc.publisher

Elsevier

dc.rights

info:eu-repo/semantics/openAccess

dc.rights.uri

https://creativecommons.org/licenses/by-nc-nd/2.5/ar/

dc.subject

Control Multimodal

dc.subject

Programación Dinámica

dc.subject

Procesos Gaussianos

dc.subject

Incertidumbre

dc.subject

Política

dc.subject.classification

Sistemas de Automatización y Control Se ha confirmado la validez de este valor de autoridad por un usuario

dc.subject.classification

Ingeniería Eléctrica, Ingeniería Electrónica e Ingeniería de la Información Se ha confirmado la validez de este valor de autoridad por un usuario

dc.subject.classification

INGENIERÍAS Y TECNOLOGÍAS Se ha confirmado la validez de este valor de autoridad por un usuario

dc.title

Control Multimodal en Entornos Inciertos usando Aprendizaje por Refuerzos y Procesos Gaussianos

dc.type

info:eu-repo/semantics/article

dc.type

info:ar-repo/semantics/artículo

dc.type

info:eu-repo/semantics/publishedVersion

dc.date.updated

2016-08-01T18:37:55Z

dc.journal.volume

12

dc.journal.number

4

dc.journal.pagination

385-396

dc.journal.pais

España

dc.journal.ciudad

Valencia

dc.description.fil

Fil: de Paula, Mariano. Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ingeniería Olavarria. Departamento de Electromecánica. Grupo INTELYMEC; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Tandil. Centro de Investigaciones en Física e Ingeniería del Centro de la Provincia de Buenos Aires; Argentina

dc.description.fil

Fil: Avila, Luis Omar. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Santa Fe. Instituto de Desarrollo y Diseño (i); Argentina

dc.description.fil

Fil: Sánchez Reinoso, Carlos Roberto. Universidad Nacional de Catamarca. Facultad de Tecnologia y Ciencias Aplicadas; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas; Argentina

dc.description.fil

Fil: Acosta, Gerardo Gabriel. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Tandil. Centro de Investigaciones en Física e Ingeniería del Centro de la Provincia de Buenos Aires; Argentina. Universidad Nacional del Centro de la Provincia de Buenos Aires. Facultad de Ingeniería Olavarria. Departamento de Electromecánica. Grupo INTELYMEC; Argentina

dc.journal.title

Revista Iberoamericana de Automatica E Informatica Industrial Se ha confirmado la validez de este valor de autoridad por un usuario

dc.relation.alternativeid

info:eu-repo/semantics/altIdentifier/url/http://www.sciencedirect.com/science/article/pii/S1697791215000552

dc.relation.alternativeid

info:eu-repo/semantics/altIdentifier/url/http://goo.gl/yZeVQN

dc.relation.alternativeid

info:eu-repo/semantics/altIdentifier/doi/10.1016/j.riai.2015.09.004

dc.relation.alternativeid

info:eu-repo/semantics/altIdentifier/doi/http://dx.doi.org/10.1016/j.riai.2015.09.004

Archivos asociados

Tamaño: 2.768Mb

Formato: PDF

Descargar