Saltar para:
Logótipo
Você está em: Início > Publicações > Visualização > Couillard: Parallel programming via coarse-grained Data-flow Compilation

Couillard: Parallel programming via coarse-grained Data-flow Compilation

Título
Couillard: Parallel programming via coarse-grained Data-flow Compilation
Tipo
Artigo em Revista Científica Internacional
Ano
2014
Autores
Leandro A J Marzulo
(Autor)
Outra
A pessoa não pertence à instituição. A pessoa não pertence à instituição. A pessoa não pertence à instituição. Sem AUTHENTICUS Sem ORCID
Tiago A O Alves
(Autor)
Outra
A pessoa não pertence à instituição. A pessoa não pertence à instituição. A pessoa não pertence à instituição. Sem AUTHENTICUS Sem ORCID
Felipe M G Franca
(Autor)
Outra
A pessoa não pertence à instituição. A pessoa não pertence à instituição. A pessoa não pertence à instituição. Sem AUTHENTICUS Sem ORCID
Vitor Santos Costa
(Autor)
FCUP
Revista
Título: Parallel ComputingImportada do Authenticus Pesquisar Publicações da Revista
Vol. 40
Páginas: 661-680
ISSN: 0167-8191
Editora: Elsevier
Classificação Científica
FOS: Ciências exactas e naturais > Ciências da computação e da informação
Outras Informações
ID Authenticus: P-009-ZC7
Abstract (EN): Data-flow is a natural approach to parallelism. However, describing dependencies and control between fine-grained data-flow tasks can be complex and present unwanted overheads. TALM (TALM is an Architecture and Language for Multi-threading) introduces a user-defined coarse-grained parallel data-flow model, where programmers identify code blocks, called super-instructions, to be run in parallel and connect them in a data-flow graph. TALM has been implemented as a hybrid Von Neumann/data-flow execution system: the Trebuchet. We have observed that TALM's usefulness largely depends on how programmers specify and connect super-instructions. Thus, we present Couillard, a full compiler that creates, based on an annotated C-program, a data-flow graph and C-code corresponding to each super-instruction. We show that our toolchain allows one to benefit from data-flow execution and explore sophisticated parallel programming techniques, with small effort. To evaluate our system we have executed a set of real applications on a large multi-core machine. Comparison with popular parallel programming methods shows competitive speedups, while providing an easier parallel programing approach. More specifically, for an application that follows the wavefront method, running with big inputs, Trebuchet achieved up to 4.7% speedup over Intel (R) TBB novel flow-graph approach and up to 44% over OpenMP.
Idioma: Inglês
Tipo (Avaliação Docente): Científica
Nº de páginas: 20
Documentos
Não foi encontrado nenhum documento associado à publicação.
Publicações Relacionadas

Da mesma revista

Dynamic scheduling of a batch of parallel task jobs on heterogeneous clusters (2011)
Artigo em Revista Científica Internacional
Jorge G. Barbosa; Belmiro Moreira
A sleek lock-free hash map in an ERA of safe memory reclamation methods (2025)
Artigo em Revista Científica Internacional
Moreno, P; Miguel Areias; Ricardo Rocha
Recomendar Página Voltar ao Topo
Copyright 1996-2026 © Faculdade de Farmácia da Universidade do Porto  I Termos e Condições  I Acessibilidade  I Índice A-Z
Página gerada em: 2026-02-14 às 09:21:08 | Política de Privacidade | Política de Proteção de Dados Pessoais | Denúncias | Livro Amarelo Eletrónico