Saltar para:
Logótipo
Comuta visibilidade da coluna esquerda
Você está em: Início > Publicações > Visualização > Scalable transcriptomics analysis with Dask: applications in data science and machine learning

Publicações

Scalable transcriptomics analysis with Dask: applications in data science and machine learning

Título
Scalable transcriptomics analysis with Dask: applications in data science and machine learning
Tipo
Artigo em Revista Científica Internacional
Ano
2022
Autores
Moreno, M
(Autor)
Outra
A pessoa não pertence à instituição. A pessoa não pertence à instituição. A pessoa não pertence à instituição. Sem AUTHENTICUS Sem ORCID
Vilaca, R
(Autor)
Outra
A pessoa não pertence à instituição. A pessoa não pertence à instituição. A pessoa não pertence à instituição. Ver página do Authenticus Sem ORCID
Revista
Título: BMC BioinformaticsImportada do Authenticus Pesquisar Publicações da Revista
Vol. 23
Página Final: 514
ISSN: 1471-2105
Editora: Springer Nature
Outras Informações
ID Authenticus: P-00X-QNH
Abstract (EN): Background: Gene expression studies are an important tool in biological and biomedical research. The signal carried in expression profiles helps derive signatures for the prediction, diagnosis and prognosis of different diseases. Data science and specifically machine learning have many applications in gene expression analysis. However, as the dimensionality of genomics datasets grows, scalable solutions become necessary. Methods: In this paper we review the main steps and bottlenecks in machine learning pipelines, as well as the main concepts behind scalable data science including those of concurrent and parallel programming. We discuss the benefits of the Dask framework and how it can be integrated with the Python scientific environment to perform data analysis in computational biology and bioinformatics. Results: This review illustrates the role of Dask for boosting data science applications in different case studies. Detailed documentation and code on these procedures is made available at https:// github. com/martaccmoreno/gexp-ml-dask. Conclusion: By showing when and how Dask can be used in transcriptomics analysis, this review will serve as an entry point to help genomic data scientists develop more scalable data analysis procedures.
Idioma: Inglês
Tipo (Avaliação Docente): Científica
Nº de páginas: 20
Documentos
Não foi encontrado nenhum documento associado à publicação.
Publicações Relacionadas

Da mesma revista

Surveying alignment-free features for Ortholog detection in related yeast proteomes by using supervised big data classifiers (2018)
Artigo em Revista Científica Internacional
Galpert, D; Fernandez, A; Herrera, F; Agostinho Antunes; Molina Ruiz, R; Aguero Chapin, G
SicknessMiner: a deep-learning-driven text-mining tool to abridge disease-disease associations (2021)
Artigo em Revista Científica Internacional
Rosario Ferreira, N; Guimaraes, V; Costa, VS; Moreira, IS
LOSITAN: A workbench to detect molecular adaptation based on a F(st)-outlier method (2008)
Artigo em Revista Científica Internacional
antao, t; lopes, a; lopes, rj; beja-pereira, a; luikart, g
LMAP_S: Lightweight Multigene Alignment and Phylogeny eStimation (2019)
Artigo em Revista Científica Internacional
Maldonado, E; Agostinho Antunes
LMAP: Lightweight Multigene Analyses in PAML (2016)
Artigo em Revista Científica Internacional
Maldonado, E; Almeida, D; Escalona, T; Khan, I; Vitor Vasconcelos; Agostinho Antunes

Ver todas (7)

Recomendar Página Voltar ao Topo
Copyright 1996-2025 © Faculdade de Direito da Universidade do Porto  I Termos e Condições  I Acessibilidade  I Índice A-Z
Página gerada em: 2025-07-24 às 13:40:18 | Política de Privacidade | Política de Proteção de Dados Pessoais | Denúncias