Saltar para:
Logótipo
Comuta visibilidade da coluna esquerda
Você está em: Início > Publicações > Visualização > D-Confidence: An active learning strategy to reduce label disclosure complexity in the presence of imbalanced class distributions

Publicações

D-Confidence: An active learning strategy to reduce label disclosure complexity in the presence of imbalanced class distributions

Título
D-Confidence: An active learning strategy to reduce label disclosure complexity in the presence of imbalanced class distributions
Tipo
Artigo em Revista Científica Internacional
Ano
2012
Autores
Escudeiro, NF
(Autor)
Outra
A pessoa não pertence à instituição. A pessoa não pertence à instituição. A pessoa não pertence à instituição. Ver página do Authenticus Sem ORCID
Jorge, AM
(Autor)
FCUP
Ver página pessoal Sem permissões para visualizar e-mail institucional Pesquisar Publicações do Participante Ver página do Authenticus Sem ORCID
Revista
Vol. 18
Páginas: 311-330
ISSN: 0104-6500
Editora: Springer Nature
Indexação
Outras Informações
ID Authenticus: P-008-6M3
Abstract (EN): In some classification tasks, such as those related to the automatic building and maintenance of text corpora, it is expensive to obtain labeled instances to train a classifier. In such circumstances it is common to have massive corpora where a few instances are labeled (typically a minority) while others are not. Semi-supervised learning techniques try to leverage the intrinsic information in unlabeled instances to improve classification models. However, these techniques assume that the labeled instances cover all the classes to learn which might not be the case. Moreover, when in the presence of an imbalanced class distribution, getting labeled instances from minority classes might be very costly, requiring extensive labeling, if queries are randomly selected. Active learning allows asking an oracle to label new instances, which are selected by criteria, aiming to reduce the labeling effort. D-Confidence is an active learning approach that is effective when in presence of imbalanced training sets. In this paper we evaluate the performance of d-Confidence in comparison to its baseline criteria over tabular and text datasets. We provide empirical evidence that d-Confidence reduces label disclosure complexity-which we have defined as the number of queries required to identify instances from all classes to learn-when in the presence of imbalanced data. © 2012 The Brazilian Computer Society.
Idioma: Inglês
Tipo (Avaliação Docente): Científica
Documentos
Não foi encontrado nenhum documento associado à publicação.
Publicações Relacionadas

Da mesma revista

Ranking MEDLINE documents (2014)
Artigo em Revista Científica Internacional
Célia Valente; Rui Camacho; Eugénio Oliveira
Gene clusters as intersections of powers of paths (2012)
Artigo em Revista Científica Internacional
Costa, VS; Dantas, S; Sankoff, D; Xu, X
Forgetting mechanisms for scalable collaborative filtering (2012)
Artigo em Revista Científica Internacional
Vinagre, J; Jorge, AM
A set of novel modifications to improve algorithms from the A* family applied in mobile robotics (2013)
Artigo em Revista Científica Internacional
Tiago Nascimento; Pedro Gomes Da Costa; Paulo Gomes Da Costa; António Paulo Moreira; André Conceição
A data warehouse to support web site automation (2014)
Artigo em Revista Científica Internacional
Marcos Aurélio Domingues; Carlos Soares; Alípio Mário Jorge; Solange Oliveira Rezende
Recomendar Página Voltar ao Topo
Copyright 1996-2025 © Faculdade de Direito da Universidade do Porto  I Termos e Condições  I Acessibilidade  I Índice A-Z
Página gerada em: 2025-07-16 às 23:23:18 | Política de Privacidade | Política de Proteção de Dados Pessoais | Denúncias