Saltar para:
Logótipo
Comuta visibilidade da coluna esquerda
Você está em: Início > Publicações > Visualização > Non-Parametric Contextual Stochastic Search

Non-Parametric Contextual Stochastic Search

Título
Non-Parametric Contextual Stochastic Search
Tipo
Artigo em Livro de Atas de Conferência Internacional
Ano
2016
Autores
Abdolmaleki, A
(Autor)
Outra
A pessoa não pertence à instituição. A pessoa não pertence à instituição. A pessoa não pertence à instituição. Sem AUTHENTICUS Sem ORCID
lau, n
(Autor)
FCUP
Ver página pessoal Sem permissões para visualizar e-mail institucional Pesquisar Publicações do Participante Ver página do Authenticus Sem ORCID
Neumann, G
(Autor)
Outra
A pessoa não pertence à instituição. A pessoa não pertence à instituição. A pessoa não pertence à instituição. Sem AUTHENTICUS Sem ORCID
Outras Informações
ID Authenticus: P-00M-8CW
Abstract (EN): Stochastic search algorithms are black-box optimizer of an objective function. They have recently gained a lot of attention in operations research, machine learning and policy search of robot motor skills due to their ease of use and their generality. Yet, many stochastic search algorithms require relearning if the task or objective function changes slightly to adapt the solution to the new situation or the new context. In this paper, we consider the contextual stochastic search setup. Here, we want to find multiple good parameter vectors for multiple related tasks, where each task is described by a continuous context vector. Hence, the objective function might change slightly for each parameter vector evaluation of a task or context. Contextual algorithms have been investigated in the field of policy search, however, the search distribution typically uses a parametric model that is linear in the some hand-defined context features. Finding good context features is a challenging task, and hence, non-parametric methods are often preferred over their parametric counter-parts. In this paper, we propose a non-parametric contextual stochastic search algorithm that can learn a non-parametric search distribution for multiple tasks simultaneously. In difference to existing methods, our method can also learn a context dependent covariance matrix that guides the exploration of the search process. We illustrate its performance on several non-linear contextual tasks.
Idioma: Inglês
Tipo (Avaliação Docente): Científica
Nº de páginas: 6
Documentos
Não foi encontrado nenhum documento associado à publicação.
Publicações Relacionadas

Dos mesmos autores

Contextual Policy Search for Linear and Nonlinear Generalization of a Humanoid Walking Controller (2016)
Artigo em Revista Científica Internacional
Abdolmaleki, A; lau, n; reis, lp; Peters, J; Neumann, G
Stochastic Search In Changing Situations (2017)
Artigo em Livro de Atas de Conferência Internacional
Abdolmaleki, A; Simães, DA; lau, n; reis, lp; Price, B; Neumann, G
Regularized Covariance Estimation for Weighted Maximum Likelihood Policy Search Methods (2015)
Artigo em Livro de Atas de Conferência Internacional
Abdolmaleki, A; lau, n; reis, lp; Neumann, G
Model-Based Relative Entropy Stochastic Search (2016)
Artigo em Livro de Atas de Conferência Internacional
Abdolmaleki, A; Lioutikov, R; lau, n; reis, lp; Peters, J; Neumann, G
Learning a Humanoid Kick with Controlled Distance (2016)
Artigo em Livro de Atas de Conferência Internacional
Abdolmaleki, A; Simões, D; lau, n; reis, lp; Neumann, G

Ver todas (10)

Recomendar Página Voltar ao Topo
Copyright 1996-2025 © Centro de Desporto da Universidade do Porto I Termos e Condições I Acessibilidade I Índice A-Z
Página gerada em: 2025-11-12 às 18:59:49 | Política de Privacidade | Política de Proteção de Dados Pessoais | Denúncias | Livro Amarelo Eletrónico