Saltar para:
Logótipo
Você está em: Início > Publicações > Visualização > Multi-agent Double Deep Q-Networks

Multi-agent Double Deep Q-Networks

Título
Multi-agent Double Deep Q-Networks
Tipo
Artigo em Livro de Atas de Conferência Internacional
Ano
2017
Autores
Simoes, D
(Autor)
Outra
A pessoa não pertence à instituição. A pessoa não pertence à instituição. A pessoa não pertence à instituição. Sem AUTHENTICUS Sem ORCID
lau, n
(Autor)
FCUP
Ver página pessoal Sem permissões para visualizar e-mail institucional Pesquisar Publicações do Participante Ver página do Authenticus Sem ORCID
Ata de Conferência Internacional
Páginas: 123-134
18th EPIA Conference on Artificial Intelligence (EPIA)
Univ Porto, Fac Engn, Porto, PORTUGAL, SEP 05-08, 2017
Outras Informações
ID Authenticus: P-00M-YK9
Abstract (EN): There are many open issues and challenges in the multi-agent reward-based learning field. Theoretical convergence guarantees are lost, and the complexity of the action-space is also exponential to the amount of agents calculating their optimal joint-action. Function approximators, such as deep neural networks, have successfully been used in singleagent environments with high dimensional state-spaces. We propose the Multi-agent Double Deep Q-Networks algorithm, an extension of Deep Q-Networks to the multi-agent paradigm. Two common techniques of multi-agent Q-learning are used to formally describe our proposal, and are tested in a Foraging Task and a Pursuit Game. We also demonstrate how they can generalize to similar tasks and to larger teams, due to the strength of deep-learning techniques, and their viability for transfer learning approaches. With only a small fraction of the initial task's training, we adapt to longer tasks, and we accelerate the task completion by increasing the team size, thus empirically demonstrating a solution to the complexity issues of the multi-agent field.
Idioma: Inglês
Tipo (Avaliação Docente): Científica
Nº de páginas: 12
Documentos
Não foi encontrado nenhum documento associado à publicação.
Publicações Relacionadas

Dos mesmos autores

Multi-agent actor centralized-critic with communication (2020)
Artigo em Revista Científica Internacional
Simoes, D; lau, n; reis, lp
MULTI AGENT DEEP LEARNING WITH COOPERATIVE COMMUNICATION (2020)
Artigo em Revista Científica Internacional
Simoes, D; lau, n; reis, lp
Exploring communication protocols and centralized critics in multi-agent deep learning (2020)
Artigo em Revista Científica Internacional
Simoes, D; lau, n; reis, lp
Learning Low-Level Behaviors and High-Level Strategies in Humanoid Soccer (2020)
Artigo em Livro de Atas de Conferência Internacional
Simoes, D; Amaro, P; Maria Teresa Andrade; lau, n; reis, lp
Contextual Relative Entropy Policy Search with Covariance Matrix Adaptation (2016)
Artigo em Livro de Atas de Conferência Internacional
Abdolmaleki, A; Simoes, D; lau, n; reis, lp; Neumann, G
Recomendar Página Voltar ao Topo
Copyright 1996-2024 © Faculdade de Arquitectura da Universidade do Porto  I Termos e Condições  I Acessibilidade  I Índice A-Z  I Livro de Visitas
Página gerada em: 2024-10-06 às 11:23:50 | Política de Utilização Aceitável | Política de Proteção de Dados Pessoais | Denúncias