Saltar para:
Logótipo
Comuta visibilidade da coluna esquerda
Você está em: Início > Publicações > Visualização > Resource-bounded outlier detection using clustering methods

Publicações

Resource-bounded outlier detection using clustering methods

Título
Resource-bounded outlier detection using clustering methods
Tipo
Artigo em Revista Científica Internacional
Ano
2010
Autores
Torgo, L
(Autor)
FCUP
Ver página pessoal Sem permissões para visualizar e-mail institucional Pesquisar Publicações do Participante Ver página do Authenticus Sem ORCID
Soares, C
(Autor)
FEP
Revista
Vol. 218
Páginas: 84-98
ISSN: 0922-6389
Editora: IOS PRESS
Indexação
Publicação em ISI Web of Knowledge ISI Web of Knowledge
Outras Informações
ID Authenticus: P-007-W1T
Abstract (EN): This paper describes a methodology for the application of hierarchical clustering methods to the task of outlier detection. The methodology is tested on the problem of cleaning Official Statistics data. The goal is to detect erroneous foreign trade transactions in data collected by the Portuguese Institute of Statistics (INE). These transactions are a minority, but still they have an important impact on the statistics produced by the institute. The detectiong of these rare errors is a manual, time-consuming task. This type of tasks is usually constrained by a limited amount of available resources. Our proposal addresses this issue by producing a ranking of outlyingness that allows a better management of the available resources by allocating them to the cases which are most different from the other and, thus, have a higher probability of being errors. Our method is based on the output of standard agglomerative hierarchical clustering algorithms, resulting in no significant additional computational costs. Our results show that it enables large savings by selecting a small subset of suspicious transactions for manual inspection, which, nevertheless, includes most of the erroneous transactions. In this study we compare our proposal to a state of the art outlier ranking method (LOF) and show that our method achieves better results on this particular application. The results of our experiments are also competitive with previous results on the same data. Finally, the outcome of our experiments raises important questions concerning the method currently followed at INE concerning items with small number of transactions.
Idioma: Inglês
Tipo (Avaliação Docente): Científica
Nº de páginas: 15
Documentos
Não foi encontrado nenhum documento associado à publicação.
Publicações Relacionadas

Dos mesmos autores

Model Selection for Time Series Forecasting An Empirical Analysis of Multiple Estimators (2023)
Artigo em Revista Científica Internacional
Cerqueira, V; Torgo, L; Carlos Soares
Early anomaly detection in time series: a hierarchical approach for predicting critical health episodes (2023)
Artigo em Revista Científica Internacional
Cerqueira, V; Torgo, L; Carlos Soares
Dynamic discretization of continuous attributes (1998)
Artigo em Revista Científica Internacional
Gama, J; Torgo, L; Soares, C
Arbitrage of forecasting experts (2019)
Artigo em Revista Científica Internacional
Vitor Cerqueira; Luís Torgo; Fábio Pinto; Carlos Soares
A case study comparing machine learning with statistical methods for time series forecasting: size matters (2022)
Artigo em Revista Científica Internacional
Cerqueira, V; Torgo, L; Carlos Soares

Ver todas (14)

Da mesma revista

Preface (2008)
Outra Publicação em Revista Científica Internacional
Soares, C; Peng, Y; Meng, J; Washio, T; Zhou, ZH
Frontiers in Artificial Intelligence and Applications: Preface (2010)
Outra Publicação em Revista Científica Internacional
Soares, C; Ghani, R
Applications of Data Mining in E-Business Finance: Introduction (2007)
Capítulo ou Parte de Livro
Soares, C; Peng, Y; Meng, J; Washio, T; Zhou, ZH
Robust Division in Clustering of Streaming Time Series (2008)
Artigo em Revista Científica Internacional
Pedro Pereira Rodrigues; Joao Gama
Learning from Data Streams: Synopsis and Change Detection (2008)
Artigo em Revista Científica Internacional
Raquel Sebastiao; Joao Gama; Teresa Mendonca

Ver todas (7)

Recomendar Página Voltar ao Topo
Copyright 1996-2025 © Faculdade de Direito da Universidade do Porto  I Termos e Condições  I Acessibilidade  I Índice A-Z
Página gerada em: 2025-08-21 às 15:51:25 | Política de Privacidade | Política de Proteção de Dados Pessoais | Denúncias