Saltar para:
Logótipo
Você está em: Início > Publicações > Visualização > Robust biped locomotion using deep reinforcement learning on top of an analytical control approach

Robust biped locomotion using deep reinforcement learning on top of an analytical control approach

Título
Robust biped locomotion using deep reinforcement learning on top of an analytical control approach
Tipo
Artigo em Revista Científica Internacional
Ano
2021
Autores
Kasaei, M
(Autor)
Outra
A pessoa não pertence à instituição. A pessoa não pertence à instituição. A pessoa não pertence à instituição. Sem AUTHENTICUS Sem ORCID
Abreu, M
(Autor)
Outra
A pessoa não pertence à instituição. A pessoa não pertence à instituição. A pessoa não pertence à instituição. Ver página do Authenticus Sem ORCID
lau, n
(Autor)
Outra
Ver página pessoal Sem permissões para visualizar e-mail institucional Pesquisar Publicações do Participante Ver página do Authenticus Sem ORCID
Pereira, A
(Autor)
Outra
A pessoa não pertence à instituição. A pessoa não pertence à instituição. A pessoa não pertence à instituição. Sem AUTHENTICUS Sem ORCID
Revista
Vol. 146
ISSN: 0921-8890
Editora: Elsevier
Indexação
Publicação em ISI Web of Knowledge ISI Web of Knowledge - 0 Citações
Outras Informações
ID Authenticus: P-00V-KPY
Abstract (EN): This paper proposes a modular framework to generate robust biped locomotion using a tight coupling between an analytical walking approach and deep reinforcement learning. This framework is composed of six main modules which are hierarchically connected to reduce the overall complexity and increase its flexibility. The core of this framework is a specific dynamics model which abstracts a humanoid's dynamics model into two masses for modeling upper and lower body. This dynamics model is used to design an adaptive reference trajectories planner and an optimal controller which are fully parametric. Furthermore, a learning framework is developed based on Genetic Algorithm (GA) and Proximal Policy Optimization (PPO) to find the optimum parameters and to learn how to improve the stability of the robot by moving the arms and changing its center of mass height. A set of simulations are performed to validate the performance of the framework using the official RoboCup 3D League simulation environment. The results validate the performance of the framework, not only in creating a fast and stable gait but also in learning to improve the upper body efficiency.
Idioma: Inglês
Tipo (Avaliação Docente): Científica
Nº de páginas: 13
Documentos
Não foi encontrado nenhum documento associado à publicação.
Publicações Relacionadas

Dos mesmos autores

Learning hybrid locomotion skills-Learn to exploit residual actions and modulate model-based gait control (2023)
Artigo em Revista Científica Internacional
Kasaei, M; Abreu, M; lau, n; Pereira, A; reis, lp; Li, ZB

Da mesma revista

Visual motion perception for mobile robots through dense optical flow fields (2017)
Artigo em Revista Científica Internacional
Pinto, AM; Paulo Gomes da Costa; Correia, M. V.; Aníbal Castilho Coimbra de Matos; António Paulo Moreira
Urban@CRAS dataset: Benchmarking of visual odometry and SLAM techniques (2018)
Artigo em Revista Científica Internacional
Ana Rita Gaspar; Alexandra Nunes; Andry Maykol Pinto; Aníbal Matos
Robust 3/6 DoF self-localization system with selective map update for mobile robot platforms (2016)
Artigo em Revista Científica Internacional
Costa, CM; Sobreira, HM; Armando Jorge Sousa; Germano Veiga
Particle filter refinement based on clustering procedures for high-dimensional localization and mapping systems (2021)
Artigo em Revista Científica Internacional
André Silva Aguiar; Filipe Neves Santos; Héber Sobreira; José Boaventura Cunha; Armando Jorge Sousa
On the behaviour of low cost laser scanners in HW/SW particle filter SLAM applications (2016)
Artigo em Revista Científica Internacional
Sileshi, BG; Oliver, J; Toledo, R; Goncalves, J; Paulo Gomes da Costa

Ver todas (14)

Recomendar Página Voltar ao Topo
Copyright 1996-2024 © Faculdade de Arquitectura da Universidade do Porto  I Termos e Condições  I Acessibilidade  I Índice A-Z  I Livro de Visitas
Página gerada em: 2024-10-06 às 04:17:21 | Política de Utilização Aceitável | Política de Proteção de Dados Pessoais | Denúncias