Saltar para:
Logótipo
Você está em: Início > Publicações > Visualização > Contextual Direct Policy Search

Contextual Direct Policy Search

Título
Contextual Direct Policy Search
Tipo
Artigo em Revista Científica Internacional
Ano
2019
Autores
Abbas Abdolmaleki
(Autor)
Outra
A pessoa não pertence à instituição. A pessoa não pertence à instituição. A pessoa não pertence à instituição. Sem AUTHENTICUS Sem ORCID
David Simoes
(Autor)
Outra
A pessoa não pertence à instituição. A pessoa não pertence à instituição. A pessoa não pertence à instituição. Sem AUTHENTICUS Sem ORCID
Nuno Lau
(Autor)
Outra
A pessoa não pertence à instituição. A pessoa não pertence à instituição. A pessoa não pertence à instituição. Sem AUTHENTICUS Sem ORCID
Gerhard Neumann
(Autor)
Outra
A pessoa não pertence à instituição. A pessoa não pertence à instituição. A pessoa não pertence à instituição. Sem AUTHENTICUS Sem ORCID
Revista
Vol. 96 2
Páginas: 141-157
ISSN: 0921-0296
Editora: Springer Nature
Indexação
Publicação em ISI Web of Knowledge ISI Web of Knowledge - 0 Citações
Publicação em Scopus Scopus - 0 Citações
Outras Informações
ID Authenticus: P-00R-ZZ5
Abstract (EN): Stochastic search and optimization techniques are used in a vast number of areas, ranging from refining the design of vehicles, determining the effectiveness of new drugs, developing efficient strategies in games, or learning proper behaviors in robotics. However, they specialize for the specific problem they are solving, and if the problem's context slightly changes, they cannot adapt properly. In fact, they require complete re-leaning in order to perform correctly in new unseen scenarios, regardless of how similar they are to previous learned environments. Contextual algorithms have recently emerged as solutions to this problem. They learn the policy for a task that depends on a given context, such that widely different contexts belonging to the same task are learned simultaneously. That being said, the state-of-the-art proposals of this class of algorithms prematurely converge, and simply cannot compete with algorithms that learn a policy for a single context. We describe the Contextual Relative Entropy Policy Search (CREPS) algorithm, which belongs to the before-mentioned class of contextual algorithms. We extend it with a technique that allows the algorithm to severely increase its performance, and we call it Contextual Relative Entropy Policy Search with Covariance Matrix Adaptation (CREPS-CMA). We propose two variants, and demonstrate their behavior in a set of classic contextual optimization problems, and on complex simulator robot tasks.
Idioma: Inglês
Tipo (Avaliação Docente): Científica
Nº de páginas: 17
Documentos
Não foi encontrado nenhum documento associado à publicação.
Publicações Relacionadas

Da mesma revista

Special Issue on Autonomous Robot Systems (2015)
Outra Publicação em Revista Científica Internacional
reis, lp; calado, jmf; rocha, rp
Autonomous Robot Systems (2016)
Outra Publicação em Revista Científica Internacional
Luis Almeida; Marques, L
Active Perception Fruit Harvesting Robots - A Systematic Review (2022)
Outra Publicação em Revista Científica Internacional
Magalhaes, SA; António Paulo Moreira; Filipe Neves Santos; Dias, J
6D Localization and Kicking for Humanoid Robotic Soccer (2021)
Artigo em Revista Científica Internacional
Miguel Abreu; Tiago Silva; Henrique Teixeira; Luís Paulo Reis; Nuno Lau
Using Pre-Computed Knowledge for Goal Allocation in Multi-Agent Planning (2020)
Artigo em Revista Científica Internacional
António Paulo Moreira

Ver todas (25)

Recomendar Página Voltar ao Topo
Copyright 1996-2025 © Faculdade de Medicina Dentária da Universidade do Porto  I Termos e Condições  I Acessibilidade  I Índice A-Z
Página gerada em: 2025-07-31 às 02:53:47 | Política de Privacidade | Política de Proteção de Dados Pessoais | Denúncias | Livro Amarelo Eletrónico