Algoritmos para Bioinformática
Áreas Científicas |
Classificação |
Área Científica |
OFICIAL |
Ciência de Computadores |
Ocorrência: 2022/2023 - 2S
Ciclos de Estudo/Cursos
Língua de trabalho
Português - Suitable for English-speaking students
Objetivos
A Bioinformática é um campo do conhecimento interdisciplinar que combina as ciências da computação, a biologia e ciências biomédicas e a estatística. A Bioinformática é orientada à aplicação e desenvolvimento de novos métodos computacionais para expandir o conhecimento biológico, biomédico ou epidemiológico. Os recentes desenvolvimentos nas tecnologias de alto-débito levaram a uma grande revolução na investigação biológica e biomédica e onde hoje a bioinformática assume um papel cada vez mais central na análise de grandes quantidades de dados.
Este curso vai-se focar nos principais algoritmos desenvolvido para responder a tarefas bioinformáticas. Será dado ênfase em algoritmos de processamento e análise de sequências, quer sejam sequências nucleotídicas (DNA ou RNA) ou sequências de aminoácidos (proteínas).
O objetivo deste curso é de que os estudantes sejam capazes de entender como funcionam estes algoritmos e como podem ser desenvolvidos e aplicados para responder a novos desafios computacionais na análise de sequências biológicas.
Resultados de aprendizagem e competências
No final deste curso é esperado do estudante que:
- Esteja familiarizado com os principais conceitos de Bioinformática incluindo os principais conceitos de biologia molecular computacional;
- Identificar as principais fontes e tipos de dados de sequências biológicas(e.g. sequências de nucleotídeos ou de aminoácidos; motifs e domínios) e como estes podem ser representados do ponto de vista computacional;
- Compreender os diferentes problemas relacionados com a análise de sequências e identificar os algoritmos e estruturas de dados mais adequados para resolver estes problemas.
- Identificar do ponto de vista algorítmico as vantagens e desvantagens de cada método. Ênfase será dada aos métodos para processamento básico de sequências, para transcrição e tradução de genes, para alinhamento pareado e múltiplo de sequências, para busca e identificação de padrões, análise filogenética a partir de sequências e grafos e redes biológicas.
- Ter uma perspectiva da Bioinformática como uma disciplina de importância crítica para alavancar a investigação na área da biologia, ciências biomédicas e da saúde; como um área de investigação com um rápido e constante desenvolvimento.
Modo de trabalho
Presencial
Pré-requisitos (conhecimentos prévios) e co-requisitos (conhecimentos simultâneos)
Programação em Python.
Programa
- Perspectiva geral sobre os conceitos fundamentais de Biologia Molecular;
- Introdução à linguagem de programação Python;
- Processamento básico de sequências biológicas;
- Busca de padrões em sequências;
- Alinhamento pareado de sequências;
- Pesquisa em base de dados de sequências similares;
- Alinhamento múltiplo de sequências;
- Clustering e árvores;
- Motifs probabílisticos;
- Grafos e redes biológicas.
Bibliografia Obrigatória
Miguel Rocha and Pedro G. Ferreira; Bioinformatics Algorithms(1st Edition): Design and Implementation in Python., Elsevier, 2018. ISBN: 9780128125205
Bibliografia Complementar
Neil C. Jones and Pavel A. Pevzner ; An Introduction to Bioinformatics Algorithms (Computational Molecular Biology) 1st Edition. . ISBN: 0262101068
Sebastian Bassi; Python for Bioinformatics, CRC Press, 2016
R. Durbin, S. Eddy, A. Krogh, G. Mitchison; iological Sequence Analysis: Probabilistic Models of Proteins and Nucleic Acids, Cambridge University Press, 1998
B. Alberts, A. Johnson, J. Lewis, M. Raff, K. Roberts, P. Walter; Molecular Biology of the Cell, 4th edition, Garland Science, 2002
The official home of the Python Programming Language; The python language website
Philip Guo; Python tutor, visualization of code execution
Dan Gusfield; Algorithms on Strings, Trees and Sequences: Computer Science and Computational Biology, Cambridge University Press, 1997
Python Software Foundation; The python tutorial
Stephen F. Altschul, Warren Gish, Webb Miller, Eugene W. Myers, David J. Lipman; Basic local alignment search tool, Journal of Molecular Biology 215 (3) (1990) 403–410.
Stephen F. Altschul, Thomas L. Madden, Alejandro A. Schäffer, Jinghui Zhang, Zheng Zhang, Webb Miller, David J. Lipman; Gapped blast and psi-blast: a new generation of protein database search programs, Nucleic Acids Research 25 (17) (1997) 3389–3402.
T.L. Bailey, C. Elkan; itting a mixture model by expectation maximization to discover motifs in biopolymers, Proceedings. International Conference on Intelligent Systems for Molecular Biology 2 (1994) 28–36.
Robert S. Boyer, J. Strother Moore; A fast string searching algorithm, Communications of the ACM 20 (10) (October 1977) 762–772.
Humberto Carrillo, David Lipman; The multiple sequence alignment problem in biology, SIAM Journal on Applied Mathematics 48 (5) (1988) 1073–1082.
M.K. Das, H.K. Dai; A survey of DNA motif finding algorithms, BMC Bioinformatics 8 (Suppl 7) (Nov 2007) S21.
Desmond G. Higgins, Paul M. Sharp; Clustal: a package for performing multiple sequence alignment on a microcomputer, Gene 73 (1) (1988) 237–244.
P. D’haeseleer; What are DNA sequence motifs? Nature Biotechnology 24 (4) (Apr 2006) 423–425.
Métodos de ensino e atividades de aprendizagem
- Aulas teóricas: exposição de matéria acompanhada de exemplos.
- Aulas práticas: implementação (em Python) de algoritmos e trabalhos práticos de suporte.
Software
Python3
Tipo de avaliação
Avaliação distribuída com exame final
Componentes de Avaliação
Designação |
Peso (%) |
Exame |
60,00 |
Trabalho prático ou de projeto |
40,00 |
Total: |
100,00 |
Componentes de Ocupação
Designação |
Tempo (Horas) |
Estudo autónomo |
120,00 |
Frequência das aulas |
42,00 |
Total: |
162,00 |
Obtenção de frequência
- Presença ativa em pelo menos metade das aulas (a menos que seja concedida uma exceção).
- Será necessária uma nota mínima de 7 valores nas componentes de avaliação de exame e na componente de trabalho prático ou projeto.
Fórmula de cálculo da classificação final
Critério de avaliação:
A nota da UC será determinada pelo aproveitamento satisfatório (
nota mínima de 7 valores) nos trabalhos práticos e no exame final. A contribuição de cada componente para a nota final será:
E: Exame final: 60%
P: Trabalhos: 40% (trabalhos práticos e teóricos semanais). Este trabalhos serão realizados individualmente ou em grupo e deverão ser submetidos durante a semana da aula.
O cálculo da componente P será realizada da seguinte forma:
P = media(Trabalhos) + Bonus[soma(Presenças Ativas)/12 * 2]
Nota Final = P x 0. 40 + 0.6 x EApenas a componente
E é melhorável.
Avaliação especial (TE, DA, ...)
Os estudantes com circunstâncias especiais devem discutir a sua situação com o responsável.
Melhoria de classificação
A componente de exame é melhorável na época de recurso. A componente prática e de avaliação contínua não é melhorável.
Observações
O exame será realizado em modo presencial.
Os materiais da UC estão no moodle.
Os materiais estarão todos em inglês, incluindo os enunciados dos exames. As aulas serão lecionadas em inglês só se isso se justificar.
Os estudantes podem participar/responder usando o Português ou o Inglês.