Saltar para:
Logótipo
Você está em: Início > Publicações > Visualização > Scalable subgraph counting using MapReduce

Scalable subgraph counting using MapReduce

Título
Scalable subgraph counting using MapReduce
Tipo
Artigo em Livro de Atas de Conferência Internacional
Ano
2017
Autores
Eddin, AN
(Autor)
Outra
A pessoa não pertence à instituição. A pessoa não pertence à instituição. A pessoa não pertence à instituição. Ver página do Authenticus Sem ORCID
Pedro Ribeiro
(Autor)
FCUP
Ver página pessoal Sem permissões para visualizar e-mail institucional Pesquisar Publicações do Participante Ver página do Authenticus Sem ORCID
Indexação
Outras Informações
ID Authenticus: P-00M-ZA3
Abstract (EN): Networks are powerful in representing a wide variety of systems in many fields of study. Networks are composed of smaller substructures (subgraphs) that characterize them and give important information related to their topology and functionality. Therefore, discovering and counting these subgraph patterns is very important towards mining the features of networks. Algorithmically, subgraph counting in a network is a computationally hard problem and the needed execution time grows exponentially as the size of the subgraph or the network increases. The main goal of this paper is to contribute towards subgraph search, by providing an accessible and scalable parallel methodology for counting subgraphs. For that we present a dynamic iterative MapReduce strategy to parallelize algorithms that induce an unbalanced search tree, and apply it in the subgraph counting realm. At the core of our methods lies the g-trie, a state-of-the-art data structure that was created precisely for this task. Our strategy employs an adaptive time threshold and an efficient work-sharing mechanism to dynamically do load balancing between the workers. We evaluate our implementations using Spark on a large set of representative complex networks from different fields. The results obtained are very promising and we achieved a consistent and almost linear speedup up to 32 cores, with an average efficiency close to 80%. To the best of our knowledge this is the fastest and most scalable method for subgraph counting within the MapReduce programming model. Copyright 2017 ACM.
Idioma: Inglês
Tipo (Avaliação Docente): Científica
Documentos
Não foi encontrado nenhum documento associado à publicação.
Publicações Relacionadas

Dos mesmos autores

Deep-Graph-Sprints: Accelerated Representation Learning in Continuous-Time Dynamic Graphs (2024)
Artigo em Revista Científica Internacional
Eddin, AN; Bono, J; Aparício, DO; Ferreira, H; Pedro Ribeiro; Bizarro, P
From random-walks to graph-sprints: a low-latency node embedding framework on continuous-time dynamic graphs (2023)
Artigo em Livro de Atas de Conferência Internacional
Eddin, AN; Bono, J; Aparício, D; Ferreira, H; Ascensao, J; Pedro Ribeiro; Bizarro, P
Recomendar Página Voltar ao Topo
Copyright 1996-2026 © Faculdade de Farmácia da Universidade do Porto  I Termos e Condições  I Acessibilidade  I Índice A-Z
Página gerada em: 2026-02-21 às 13:54:00 | Política de Privacidade | Política de Proteção de Dados Pessoais | Denúncias | Livro Amarelo Eletrónico