Saltar para:
Logótipo
Comuta visibilidade da coluna esquerda
Você está em: Início > Publicações > Visualização > Dynamic Multi-head Attention

Publicações

Dynamic Multi-head Attention

Título
Dynamic Multi-head Attention
Tipo
Artigo em Livro de Atas de Conferência Internacional
Ano
2024
Autores
Duarte, FF
(Autor)
Outra
A pessoa não pertence à instituição. A pessoa não pertence à instituição. A pessoa não pertence à instituição. Sem AUTHENTICUS Sem ORCID
Lau, N
(Autor)
Outra
A pessoa não pertence à instituição. A pessoa não pertence à instituição. A pessoa não pertence à instituição. Sem AUTHENTICUS Sem ORCID
Pereira, A
(Autor)
Outra
A pessoa não pertence à instituição. A pessoa não pertence à instituição. A pessoa não pertence à instituição. Sem AUTHENTICUS Sem ORCID
Ata de Conferência Internacional
Páginas: 422-439
16th International Conference on Agents and Artificial Intelligence, ICAART 2024
Rome, 24 February 2024 through 26 February 2024
Indexação
Publicação em Scopus Scopus - 0 Citações
Outras Informações
ID Authenticus: P-018-RSR
Abstract (EN): The performance of Deep Learning agents is known to be very sensitive to the parameterization values used. The additional hyperparameters associated to the computation of the attention function used in Attention-based Deep Rein-forcement Learning agents further complicate this issue. One example of this concerns the parameterization of the number of attention heads to use in multi-head attention-based agents. Usually, this hyperparameter is set manually and remains fixed throughout training. This may be neither optimal nor efficient. This work addresses this issue by endowing the agent with a policy whose purpose is to dynamically choose the number of attention heads throughout the duration of the game and according to the game state and the contextual memory of the agent, at each timestep. The results obtained seem to suggest that in some cases the use of this dynamic parameterization can improve the performance of the agent, when compared to a baseline agent with a static parameterization. The Atari 2600 videogame benchmark was used to perform and validate all the experiments. © The Author(s), under exclusive license to Springer Nature Switzerland AG 2025.
Idioma: Inglês
Tipo (Avaliação Docente): Científica
Nº de páginas: 17
Documentos
Não foi encontrado nenhum documento associado à publicação.
Publicações Relacionadas

Dos mesmos autores

A Survey of Planning and Learning in Games (2020)
Outra Publicação em Revista Científica Internacional
Duarte, FF; Lau, N; Pereira, A; reis, lp
Study on LSTM and ConvLSTM Memory-Based Deep Reinforcement Learning (2023)
Artigo em Livro de Atas de Conferência Internacional
Duarte, FF; Lau, N; Pereira, A; reis, lp
Revisiting Deep Attention Recurrent Networks (2023)
Artigo em Livro de Atas de Conferência Internacional
Duarte, FF; Lau, N; Pereira, A; reis, lp
LSTM, ConvLSTM, MDN-RNN and GridLSTM Memory-based Deep Reinforcement Learning (2023)
Artigo em Livro de Atas de Conferência Internacional
Duarte, FF; Lau, N; Pereira, A; reis, lp
Dynamically Choosing the Number of Heads in Multi-Head Attention (2024)
Artigo em Livro de Atas de Conferência Internacional
Duarte, FF; Lau, N; Pereira, A; reis, lp
Recomendar Página Voltar ao Topo
Copyright 1996-2025 © Faculdade de Direito da Universidade do Porto  I Termos e Condições  I Acessibilidade  I Índice A-Z
Página gerada em: 2025-10-02 às 07:54:33 | Política de Privacidade | Política de Proteção de Dados Pessoais | Denúncias | Livro Amarelo Eletrónico