Saltar para:
Logótipo
Você está em: Início > Publicações > Visualização > Feature extraction for the author name disambiguation problem in a bibliographic database

Feature extraction for the author name disambiguation problem in a bibliographic database

Título
Feature extraction for the author name disambiguation problem in a bibliographic database
Tipo
Artigo em Livro de Atas de Conferência Internacional
Ano
2017
Autores
Silva, JMB
(Autor)
Outra
A pessoa não pertence à instituição. A pessoa não pertence à instituição. A pessoa não pertence à instituição. Ver página do Authenticus Sem ORCID
Indexação
Classificação Científica
FOS: Ciências exactas e naturais > Ciências da computação e da informação
Outras Informações
ID Authenticus: P-00M-X02
Abstract (EN): Author name disambiguation in bibliographic databases has been, and still is, a challenging research task due to the high uncertainty there is when matching a publication author with a concrete researcher. Common approaches normally either resort to clustering to group author's publications, or use a binary classifier to decide whether a given publication is written by a specific author. Both approaches benefit from authors publishing similar works (e.g. subject areas and venues), from the previous publication history of an author (the higher, the better), and validated publicationauthor associations for model creation. However, whenever such an algorithm is confronted with different works from an author, or an author without publication history, often it makes wrong identifications. In this paper, we describe a feature extraction method that aims to avoid the previous problems. Instead of generally characterizing an author, it selectively uses features that associate the author to a certain publication. We build a Random Forest model to assess the quality of our set of features. Its goal is to predict whether a given author is the true author of a certain publication. We use a bibliographic database named Authenticus with more than 250, 000 validated author-publication associations to test model quality. Our model achieved a top result of 95.37% accuracy in predicting matches and 91.92% in a real test scenario. Furthermore, in the last case the model was able to correctly predict 61.86% of the cases where authors had no previous publication history. Copyright 2017 ACM.
Idioma: Inglês
Tipo (Avaliação Docente): Científica
Documentos
Não foi encontrado nenhum documento associado à publicação.
Publicações Relacionadas

Dos mesmos autores

OTARIOS: OpTimizing Author Ranking with Insiders/Outsiders Subnetworks (2018)
Artigo em Livro de Atas de Conferência Internacional
Silva, JMB; Aparício, DO; Silva, F
Hierarchical Expert Profiling Using Heterogeneous Information Networks (2018)
Artigo em Livro de Atas de Conferência Internacional
Silva, JMB; Pedro Ribeiro; Silva, F
Finding Dominant Nodes Using Graphlets (2019)
Artigo em Livro de Atas de Conferência Internacional
Aparício, D; Pedro Ribeiro; Silva, F; Silva, JMB
Recomendar Página Voltar ao Topo
Copyright 1996-2026 © Faculdade de Farmácia da Universidade do Porto  I Termos e Condições  I Acessibilidade  I Índice A-Z
Página gerada em: 2026-02-26 às 12:26:40 | Política de Privacidade | Política de Proteção de Dados Pessoais | Denúncias | Livro Amarelo Eletrónico