Saltar para:
Logótipo
Comuta visibilidade da coluna esquerda
Você está em: Início > Publicações > Visualização > Leveraging loanword constraints for improving machine translation in a low-resource multilingual context

Leveraging loanword constraints for improving machine translation in a low-resource multilingual context

Título
Leveraging loanword constraints for improving machine translation in a low-resource multilingual context
Tipo
Artigo em Livro de Atas de Conferência Internacional
Ano
2025
Autores
Ali, Felermino D. M. A.
(Autor)
Outra
Ver página pessoal Sem permissões para visualizar e-mail institucional Pesquisar Publicações do Participante Sem AUTHENTICUS Sem ORCID
Ata de Conferência Internacional
Páginas: 27631 -27645
2025 Conference on Empirical Methods in Natural Language Processing (EMNLP 2025)
Suzhou, China, 2025
Indexação
Crossref
Outras Informações
Resumo (PT):
Abstract (EN): This research investigates how to improve machine translation systems for low-resource languages by integrating loanword constraints as external linguistic knowledge. Focusing on the Portuguese-Emakhuwa language pair, which exhibits significant lexical borrowing, we address the challenge of effectively adapting loanwords during the translation process. To tackle this, we propose a novel approach that augments source sentences with loanword constraints, explicitly linking source-language loanwords to their target-language equivalents. Then, we perform supervised fine-tuning on multilingual neural machine translation models and multiple Large Language Models of different sizes. Our results demonstrate that incorporating loanword constraints leads to significant improvements in translation quality as well as in handling loanword adaptation correctly in target languages, as measured by different machine translation metrics. This approach offers a promising direction for improving machine translation performance in low-resource settings characterized by frequent lexical borrowing.
Idioma: Inglês
Tipo (Avaliação Docente): Científica
Documentos
Nome do Ficheiro Descrição Tamanho
2025.emnlp-main.1406 644.73 KB
Publicações Relacionadas

Dos mesmos autores

SSA-COMET: Do LLMs outperform learned metrics in evaluating MT for under-resourced African languages? (2025)
Artigo em Livro de Atas de Conferência Internacional
Li, Senyu; Wang, Jiayi; Ali, Felermino D. M. A.; Cherry, Colin ; Deutsch, Daniel; Briakou, Eleftheria ; Sousa-Silva, Rui; Cardoso, Henrique Lopes ; Stenetorp, Pontus; Adelani, David Ifeoluwa
Expanding FLORES+ benchmark for more low-resource settings: Portuguese-Emakhuwa machine translation evaluation (2024)
Artigo em Livro de Atas de Conferência Internacional
Ali, Felermino; Cardoso, Henrique Lopes ; Sousa-Silva, Rui
Evaluating WMT 2025 Metrics shared task submissions on the SSA-MTE African challenge set (2025)
Artigo em Livro de Atas de Conferência Internacional
Li, Senyu; Ali, Felermino D. M. A.; Wang, Jiayi ; Sousa-Silva, Rui; Cardoso, Henrique Lopes ; Stenetorp, Pontus ; Cherry, Colin; Adelani, David Ifeoluwa
Detecting loanwords in Emakhuwa: an extremely low-resource bantu language exhibiting significant borrowing from portuguese (2024)
Artigo em Livro de Atas de Conferência Internacional
Ali, Felermino; Cardoso, Henrique Lopes ; Sousa-Silva, Rui
Building resources for Emakhuwa: machine translation and news classification benchmarks (2024)
Artigo em Livro de Atas de Conferência Internacional
Ali, Felermino; Cardoso, Henrique Lopes ; Sousa-Silva, Rui
Recomendar Página Voltar ao Topo
Copyright 1996-2025 © Centro de Desporto da Universidade do Porto I Termos e Condições I Acessibilidade I Índice A-Z
Página gerada em: 2025-12-05 às 09:52:29 | Política de Privacidade | Política de Proteção de Dados Pessoais | Denúncias | Livro Amarelo Eletrónico