Saltar para:
Logótipo
Você está em: Início > Publicações > Visualização > Study on LSTM and ConvLSTM Memory-Based Deep Reinforcement Learning

Study on LSTM and ConvLSTM Memory-Based Deep Reinforcement Learning

Título
Study on LSTM and ConvLSTM Memory-Based Deep Reinforcement Learning
Tipo
Artigo em Livro de Atas de Conferência Internacional
Ano
2024
Autores
Duarte, FF
(Autor)
Outra
A pessoa não pertence à instituição. A pessoa não pertence à instituição. A pessoa não pertence à instituição. Sem AUTHENTICUS Sem ORCID
Lau, N
(Autor)
Outra
A pessoa não pertence à instituição. A pessoa não pertence à instituição. A pessoa não pertence à instituição. Sem AUTHENTICUS Sem ORCID
Pereira, A
(Autor)
Outra
A pessoa não pertence à instituição. A pessoa não pertence à instituição. A pessoa não pertence à instituição. Sem AUTHENTICUS Sem ORCID
Ata de Conferência Internacional
Páginas: 223-243
15th International Conference on Agents and Artificial Intelligence (ICAART)
Lisbon, PORTUGAL, FEB 22-24, 2023
Indexação
Outras Informações
ID Authenticus: P-010-9GE
Abstract (EN): Memory-based Deep Reinforcement Learning (DRL) has been successfully applied to solve vision-based control tasks from high-dimensional sensory data. While most of this work leverages the Long Short-Term Memory (LSTM) as the memory module of the agent, recent developments have revisited and extended the original formulation of the LSTM. Some of these developments include the ConvLSTM, a convolutional-based implementation of the LSTM, the MDN-RNN, the combination of a Mixture Density Network with an LSTM and the GridLSTM, a multidimensional grid of LSTM cells. It seems however unclear how these different memory modules compare to each other in terms of agent performance, when applied in the context of DRL. This work aims to perform a comparative study of several memory-based DRL agents, based on the LSTM, ConvLSTM, MDN-RNN and GridLSTM memory modules. The results obtained seem to support the claim that in some cases these more recent memory modules can improve the performance of the agent, to varying degrees, when compared to a baseline agent based on an LSTM. The experimental results were validated in the Atari 2600 videogame platform.
Idioma: Inglês
Tipo (Avaliação Docente): Científica
Nº de páginas: 21
Documentos
Não foi encontrado nenhum documento associado à publicação.
Publicações Relacionadas

Dos mesmos autores

Revisiting Deep Attention Recurrent Networks (2023)
Artigo em Livro de Atas de Conferência Internacional
Duarte, FF; Lau, N; Pereira, A; reis, lp
Comparative Study on Curiosity with Attention, Memory and Empowerment (2025)
Artigo em Livro de Atas de Conferência Internacional
Duarte, FF; Lau, N; Pereira, A; reis, lp
Recomendar Página Voltar ao Topo
Copyright 1996-2026 © Faculdade de Farmácia da Universidade do Porto  I Termos e Condições  I Acessibilidade  I Índice A-Z
Página gerada em: 2026-02-14 às 14:47:26 | Política de Privacidade | Política de Proteção de Dados Pessoais | Denúncias | Livro Amarelo Eletrónico