Saltar para:
Logótipo
Comuta visibilidade da coluna esquerda
Você está em: Início > Publicações > Visualização > Efficient clustering of web-derived data sets

Efficient clustering of web-derived data sets

Título
Efficient clustering of web-derived data sets
Tipo
Artigo em Livro de Atas de Conferência Internacional
Ano
2009
Autores
Luís Sarmento
(Autor)
Outra
A pessoa não pertence à instituição. A pessoa não pertence à instituição. A pessoa não pertence à instituição. Sem AUTHENTICUS Sem ORCID
Alexander Kehlenbeck
(Autor)
Outra
A pessoa não pertence à instituição. A pessoa não pertence à instituição. A pessoa não pertence à instituição. Sem AUTHENTICUS Sem ORCID
Eugénio Oliveira
(Autor)
FEUP
Lyle Ungar
(Autor)
Outra
A pessoa não pertence à instituição. A pessoa não pertence à instituição. A pessoa não pertence à instituição. Sem AUTHENTICUS Sem ORCID
Ata de Conferência Internacional
Páginas: 398-412
6th International Conference on Machine Learning and Data Mining in Pattern Recognition (MLDM 2009)
Leipzig, Germany, 23-25 July, 2009
Classificação Científica
FOS: Ciências exactas e naturais > Ciências da computação e da informação
CORDIS: Ciências Físicas > Ciência de computadores > Informática
Outras Informações
ID Authenticus: P-003-R7P
Abstract (EN): Many data sets derived from the web are large, high-dimensional, sparse and have a Zipfian distribution of both classes and features. On such data sets, current scalable clustering methods such as streaming clustering suffer from fragmentation. where large classes are incorrectly divided into many smaller clusters. and computational efficiency drops significantly. We present a new clustering algorithm based on connected components that addresses these issues and so works well oil web-type data.
Idioma: Inglês
Tipo (Avaliação Docente): Científica
Contacto: las@fe.up.pt; apk@google.com; eco@fe.up.pt; ungar@cis.upenn.edu
Nº de páginas: 15
Tipo de Licença: Clique para ver a licença CC BY-NC
Documentos
Nome do Ficheiro Descrição Tamanho
Efficient clustering of web-derived data sets 276.64 KB
Publicações Relacionadas

Dos mesmos autores

An Approach to Web-Scale Named-Entity Disambiguation (2009)
Artigo em Livro de Atas de Conferência Internacional
Luís Sarmento; Alexander Kehlenbeck; Eugénio Oliveira; Lyle Ungar

Das mesmas áreas científicas

SIGA-Sistema Integrado de Gestão Autárquica (1987)
Relatório Técnico
Gabriel David; Vladimiro Miranda; Maria Cristina Ribeiro
Moodle at FEUP (2005)
Relatório Técnico
Jaime Enrique Villate Matiz
Studying the Impact of the Organizational Structure on Airline Operations Control (2015)
Capítulo ou Parte de Livro
Nuno Machado; António Castro; Eugénio Oliveira
Normative and trust-based systems as enabler technologies for automated negotiation (2014)
Capítulo ou Parte de Livro
Maria Joana Urbano; Henrique Lopes Cardoso; Eugénio Oliveira; Ana Paula Rocha

Ver todas (65)

Recomendar Página Voltar ao Topo
Copyright 1996-2026 © Faculdade de Economia da Universidade do Porto  I Termos e Condições  I Acessibilidade  I Índice A-Z
Página gerada em: 2026-04-23 às 08:53:44 | Política de Privacidade | Política de Proteção de Dados Pessoais | Denúncias
SAMA2