Saltar para:
Logótipo
Comuta visibilidade da coluna esquerda
Você está em: Início > Publicações > Visualização > Convergence Analysis of Reinforcement Learning Algorithms Using Generalized Weak Contraction Mappings

Convergence Analysis of Reinforcement Learning Algorithms Using Generalized Weak Contraction Mappings

Título
Convergence Analysis of Reinforcement Learning Algorithms Using Generalized Weak Contraction Mappings
Tipo
Artigo em Revista Científica Internacional
Ano
2025
Autores
Belhenniche, A
(Autor)
Outra
A pessoa não pertence à instituição. A pessoa não pertence à instituição. A pessoa não pertence à instituição. Sem AUTHENTICUS Sem ORCID
Chertovskih, R
(Autor)
FEUP
Gonçalves, R
(Autor)
Outra
A pessoa não pertence à instituição. A pessoa não pertence à instituição. A pessoa não pertence à instituição. Sem AUTHENTICUS Sem ORCID
Revista
Título: SymmetryImportada do Authenticus Pesquisar Publicações da Revista
Vol. 17
Página Final: 750
ISSN: 2073-8994
Editora: MDPI
Indexação
Publicação em ISI Web of Knowledge ISI Web of Knowledge - 0 Citações
Publicação em Scopus Scopus - 0 Citações
Outras Informações
ID Authenticus: P-018-V6R
Abstract (EN): We investigate the convergence properties of policy iteration and value iteration algorithms in reinforcement learning by leveraging fixed-point theory, with a focus on mappings that exhibit weak contractive behavior. Unlike traditional studies that rely on strong contraction properties, such as those defined by the Banach contraction principle, we consider a more general class of mappings that includes weak contractions. Employing Zamfirscu's fixed-point theorem, we establish sufficient conditions for norm convergence in infinite-dimensional policy spaces under broad assumptions. Our approach extends the applicability of these algorithms to feedback control problems in reinforcement learning, where standard contraction conditions may not hold. Through illustrative examples, we demonstrate that this framework encompasses a wider range of operators, offering new insights into the robustness and flexibility of iterative methods in dynamic programming.
Idioma: Inglês
Tipo (Avaliação Docente): Científica
Nº de páginas: 17
Documentos
Não foi encontrado nenhum documento associado à publicação.
Publicações Relacionadas

Da mesma revista

Unveiling the Dynamics of the Universe (2016)
Outra Publicação em Revista Científica Internacional
Avelino, PP; Barreiro, T; Sofia Carvalho, CS; da Silva, A; Lobo, FSN; Martin Moruno, P; Mimoso, JP; Nunes, NJ; Rubiera Garcia, D; Saez Gomez, D; Sousa, L; Tereno, I; Trindade, A
Symmetry in Complex Systems (2020)
Outra Publicação em Revista Científica Internacional
António Mendes Lopes; Tenreiro Machado, JAT
Occurrence of Chiral Bioactive Compounds in the Aquatic Environment: A Review (2017)
Outra Publicação em Revista Científica Internacional
Cláudia Ribeiro; Ana Rita Ribeiro; Alexandra S. Maia; Maria Elizabeth Tiritan
Chiral Stationary Phases for Liquid Chromatography Based on Chitin-and Chitosan-Derived Marine Polysaccharides (2017)
Outra Publicação em Revista Científica Internacional
Ribeiro, J; M E Tiritan; Pinto, MMM; Carla Fernandes
Chiral Separation in Preparative Scale: A Brief Overview of Membranes as Tools for Enantiomeric Separation (2017)
Outra Publicação em Revista Científica Internacional
Carla Fernandes; M E Tiritan; Pinto, MMM

Ver todas (23)

Recomendar Página Voltar ao Topo
Copyright 1996-2025 © Centro de Desporto da Universidade do Porto I Termos e Condições I Acessibilidade I Índice A-Z
Página gerada em: 2025-10-24 às 12:38:38 | Política de Privacidade | Política de Proteção de Dados Pessoais | Denúncias | Livro Amarelo Eletrónico