Saltar para:
Logótipo
Comuta visibilidade da coluna esquerda
Você está em: Início > Publicações > Visualização > Exploring general-purpose protein features for distinguishing enzymes and non-enzymes within the twilight zone

Publicações

Exploring general-purpose protein features for distinguishing enzymes and non-enzymes within the twilight zone

Título
Exploring general-purpose protein features for distinguishing enzymes and non-enzymes within the twilight zone
Tipo
Artigo em Revista Científica Internacional
Ano
2017
Autores
Ruiz Blanco, YB
(Autor)
Outra
A pessoa não pertence à instituição. A pessoa não pertence à instituição. A pessoa não pertence à instituição. Sem AUTHENTICUS Sem ORCID
Agüero Chapin, G
(Autor)
Outra
A pessoa não pertence à instituição. A pessoa não pertence à instituição. A pessoa não pertence à instituição. Sem AUTHENTICUS Sem ORCID
García Hernández, E
(Autor)
Outra
A pessoa não pertence à instituição. A pessoa não pertence à instituição. A pessoa não pertence à instituição. Sem AUTHENTICUS Sem ORCID
Álvarez, O
(Autor)
Outra
A pessoa não pertence à instituição. A pessoa não pertence à instituição. A pessoa não pertence à instituição. Sem AUTHENTICUS Sem ORCID
Agostinho Antunes
(Autor)
FCUP
Ver página pessoal Sem permissões para visualizar e-mail institucional Pesquisar Publicações do Participante Ver página do Authenticus Sem ORCID
Green, J
(Autor)
Outra
A pessoa não pertence à instituição. A pessoa não pertence à instituição. A pessoa não pertence à instituição. Sem AUTHENTICUS Sem ORCID
Revista
Título: BMC BioinformaticsImportada do Authenticus Pesquisar Publicações da Revista
Vol. 18
ISSN: 1471-2105
Editora: Springer Nature
Outras Informações
ID Authenticus: P-00Q-DA2
Abstract (EN): Background: Computational prediction of protein function constitutes one of the more complex problems in Bioinformatics, because of the diversity of functions and mechanisms in that proteins exert in nature. This issue is reinforced especially for proteins that share very low primary or tertiary structure similarity to existing annotated proteomes. In this sense, new alignment-free (AF) tools are needed to overcome the inherent limitations of classic alignment-based approaches to this issue. We have recently introduced AF protein-numerical-encoding programs (TI2BioP and ProtDCal), whose sequence-based features have been successfully applied to detect remote protein homologs, post-translational modifications and antibacterial peptides. Here we aim to demonstrate the applicability of 4 AF protein descriptor families, implemented in our programs, for the identification enzyme-like proteins. At the same time, the use of our novel family of 3D-structure-based descriptors is introduced for the first time. The Dobson & Doig (D&D) benchmark dataset is used for the evaluation of our AF protein descriptors, because of its proven structural diversity that permits one to emulate an experiment within the twilight zone of alignment-based methods (pair-wise identity <30%). The performance of our sequence-based predictor was further assessed using a subset of formerly uncharacterized proteins which currently represent a benchmark annotation dataset. Results: Four protein descriptor families (sequence-composition-based (0D), linear-topology-based (1D), pseudo-fold-topology-based (2D) and 3D-structure features (3D), were assessed using the D&D benchmark dataset. We show that only the families of ProtDCal's descriptors (0D, 1D and 3D) encode significant information for enzymes and non-enzymes discrimination. The obtained 3D-structure-based classifier ranked first among several other SVM-based methods assessed in this dataset. Furthermore, the model leveraging 1D descriptors, showed a higher success rate than EzyPred on a benchmark annotation dataset from the Shewanella oneidensis proteome. Conclusions: The applicability of ProtDCal as a general-purpose-AF protein modelling method is illustrated through the discrimination between two comprehensive protein functional classes. The observed performances using the highly diverse D&D dataset, and the set of formerly uncharacterized (hard-to-annotate) proteins of Shewanella oneidensis, places our methodology on the top range of methods to model and predict protein function using alignment-free approaches. © 2017 The Author(s).
Idioma: Inglês
Tipo (Avaliação Docente): Científica
Nº de páginas: 14
Documentos
Não foi encontrado nenhum documento associado à publicação.
Publicações Relacionadas

Da mesma revista

Surveying alignment-free features for Ortholog detection in related yeast proteomes by using supervised big data classifiers (2018)
Artigo em Revista Científica Internacional
Galpert, D; Fernandez, A; Herrera, F; Agostinho Antunes; Molina Ruiz, R; Aguero Chapin, G
SicknessMiner: a deep-learning-driven text-mining tool to abridge disease-disease associations (2021)
Artigo em Revista Científica Internacional
Rosario Ferreira, N; Guimaraes, V; Costa, VS; Moreira, IS
Scalable transcriptomics analysis with Dask: applications in data science and machine learning (2022)
Artigo em Revista Científica Internacional
Moreno, M; Vilaca, R; Ferreira, PG
LOSITAN: A workbench to detect molecular adaptation based on a F(st)-outlier method (2008)
Artigo em Revista Científica Internacional
antao, t; lopes, a; lopes, rj; beja-pereira, a; luikart, g
LMAP_S: Lightweight Multigene Alignment and Phylogeny eStimation (2019)
Artigo em Revista Científica Internacional
Maldonado, E; Agostinho Antunes

Ver todas (7)

Recomendar Página Voltar ao Topo
Copyright 1996-2025 © Faculdade de Direito da Universidade do Porto  I Termos e Condições  I Acessibilidade  I Índice A-Z
Página gerada em: 2025-10-04 às 10:37:44 | Política de Privacidade | Política de Proteção de Dados Pessoais | Denúncias | Livro Amarelo Eletrónico