Saltar para:
Logótipo
Comuta visibilidade da coluna esquerda
Você está em: Início > Publicações > Visualização > Automatic sign language to text translation using MediaPipe and transformer architectures

Automatic sign language to text translation using MediaPipe and transformer architectures

Título
Automatic sign language to text translation using MediaPipe and transformer architectures
Tipo
Artigo em Revista Científica Internacional
Ano
2025
Autores
Maia, WF
(Autor)
Outra
A pessoa não pertence à instituição. A pessoa não pertence à instituição. A pessoa não pertence à instituição. Sem AUTHENTICUS Sem ORCID
António Mendes Lopes
(Autor)
FEUP
David, SA
(Autor)
Outra
A pessoa não pertence à instituição. A pessoa não pertence à instituição. A pessoa não pertence à instituição. Sem AUTHENTICUS Sem ORCID
Revista
Título: NeurocomputingImportada do Authenticus Pesquisar Publicações da Revista
Vol. 642
ISSN: 0925-2312
Editora: Elsevier
Indexação
Publicação em ISI Web of Knowledge ISI Web of Knowledge - 0 Citações
Publicação em Scopus Scopus - 0 Citações
Outras Informações
ID Authenticus: P-018-RSC
Abstract (EN): This study presents a transformer-based architecture for translating Sign Language to spoken language text using embeddings of body keypoints, with the mediation of glosses. To the best of our knowledge, this work is the first to successfully leverage body keypoints for Sign Language-to-text translation, achieving comparable performance to baseline models without reducing translation quality. Our approach introduces extensive augmentation techniques for body keypoints, and convolutional keypoint embeddings, and integrates Connectionist Temporal Classification Loss and position encoding for Sign2Gloss translation. For the Gloss2Text stage, we employ fine-tuning of BART, a state-of-the-art transformer model. Evaluation on the Phoenix14T dataset demonstrates that our integrated Sign2Gloss2Text model achieves competitive performance, with BLEU-4 scores that show marginal differences compared to baseline models using pixel embeddings. On the How2Sign dataset, which lacks gloss annotations, direct Sign2Text translation posed challenges, as reflected in lower BLEU-4 scores, highlighting the limitations of gloss-free approaches. This work addresses the narrow domain of the datasets and the unidirectional nature of the translation process while demonstrating the potential of body keypoints for Sign Language Translation. Future work will focus on enhancing the model's ability to capture nuanced and complex contexts, thereby advancing accessibility and assistive technologies for bridging communication between individuals with hearing impairments and the hearing community.
Idioma: Inglês
Tipo (Avaliação Docente): Científica
Nº de páginas: 13
Documentos
Não foi encontrado nenhum documento associado à publicação.
Publicações Relacionadas

Da mesma revista

The vitality of pattern recognition and image analysis (2015)
Outra Publicação em Revista Científica Internacional
Luisa Mico; Joao M Sanches; Jaime S Cardoso
ydata-profiling: Accelerating data-centric AI with high-quality data (2023)
Artigo em Revista Científica Internacional
Clemente, F; Ribeiro, GM; Quemy, A; Santos, MS; Pereira, RC; Barros, A
The vitality of pattern recognition and image analysis (2015)
Artigo em Revista Científica Internacional
Micó, L; Sanches, JM; Jaime S Cardoso
Pre-processing approaches for imbalanced distributions in regression (2019)
Artigo em Revista Científica Internacional
Branco, P; Torgo, L; Rita Ribeiro
Predicting satisfaction: perceived decision quality by decision-makers in Web-based group decision support systems (2019)
Artigo em Revista Científica Internacional
João Carneiro; Pedro Saraiva; Luís Conceição; Ricardo Santos; Goreti Marreiros; Paulo Novais

Ver todas (22)

Recomendar Página Voltar ao Topo
Copyright 1996-2025 © Centro de Desporto da Universidade do Porto I Termos e Condições I Acessibilidade I Índice A-Z
Página gerada em: 2025-10-16 às 15:51:20 | Política de Privacidade | Política de Proteção de Dados Pessoais | Denúncias | Livro Amarelo Eletrónico