Saltar para:
Logótipo
Você está em: Início » Publicações » Visualização » Improving word embeddings in Portuguese: increasing accuracy while reducing the size of the corpus

Improving word embeddings in Portuguese: increasing accuracy while reducing the size of the corpus

Título
Improving word embeddings in Portuguese: increasing accuracy while reducing the size of the corpus
Tipo
Artigo em Revista Científica Internacional
Ano
2022-07-18
Autores
Maria Teresa Andrade
(Autor)
FEUP
Viana P.
(Autor)
Outra
A pessoa não pertence à instituição. A pessoa não pertence à instituição. A pessoa não pertence à instituição. Sem AUTHENTICUS Sem ORCID
Pinto JP
(Autor)
Outra
A pessoa não pertence à instituição. A pessoa não pertence à instituição. A pessoa não pertence à instituição. Sem AUTHENTICUS Sem ORCID
Revista
Vol. 58
Página Final: e964
Editora: PEERJ INC
Indexação
Publicação em ISI Web of Knowledge ISI Web of Knowledge - 0 Citações
Publicação em Scopus Scopus - 0 Citações
Outras Informações
ID Authenticus: P-00X-396
Abstract (EN): The subjectiveness of multimedia content description has a strong negative impact on tag-based information retrieval. In our work, we propose enhancing available descriptions by adding semantically related tags. To cope with this objective, we use a word embedding technique based on the Word2Vec neural network parameterized and trained using a new dataset built from online newspapers. A large number of news stories was scraped and pre-processed to build a new dataset. Our target language is Portuguese, one of the most spoken languages worldwide. The results achieved significantly outperform similar existing solutions developed in the scope of different languages, including Portuguese. Contributions include also an online application and API available for external use. Although the presented work has been designed to enhance multimedia content annotation, it can be used in several other application areas.
Idioma: Inglês
Tipo (Avaliação Docente): Científica
Nº de páginas: 22
Documentos
Não foi encontrado nenhum documento associado à publicação.
Publicações Relacionadas

Da mesma revista

Supervised deep learning embeddings for the prediction of cervical cancer diagnosis (2018)
Artigo em Revista Científica Internacional
Kelwin Fernandes; Davide Chicco; Jaime S. Cardoso; Jessica Fernandes
Ordinal losses for classification of cervical cancer risk (2021)
Artigo em Revista Científica Internacional
Tomé Albuquerque; Ricardo Cruz; Jaime S. Cardoso
Formal verification of Matrix based MATLAB models using interactive theorem proving (2021)
Artigo em Revista Científica Internacional
Gauhar, A; Rashid, A; Hasan, O; João Bispo; João M. P. Cardoso
Recomendar Página Voltar ao Topo
Copyright 1996-2024 © Faculdade de Medicina da Universidade do Porto  I Termos e Condições  I Acessibilidade  I Índice A-Z  I Livro de Visitas
Página gerada em: 2024-11-05 às 10:31:48
Política de Utilização Aceitável | Política de Proteção de Dados Pessoais | Denúncias | Política de Captação e Difusão da Imagem Pessoal em Suporte Digital