Bioinformática
Áreas Científicas |
Classificação |
Área Científica |
OFICIAL |
Ciência de Computadores |
Ocorrência: 2019/2020 - 2S
Ciclos de Estudo/Cursos
Língua de trabalho
Português - Suitable for English-speaking students
Objetivos
COVID-19: Atividades Letivas à Distância
Devido a esta situação os critérios de avaliação foram alterados. Verifique por favor na parte da avaliação.
A Bioinformática é um campo do conhecimento interdisciplinar que combina as ciências da computação, a biologia e ciências biomédicas e a estatística. A Bioinformática é orientada à aplicação e desenvolvimento de novos métodos computacionais para expandir o conhecimento biológico, biomédico ou epidemiológico. Os recentes desenvolvimentos nas tecnologias de alto-débito levaram a uma grande revolução na investigação biológica e biomédica e onde hoje a bioinformática assume um papel cada vez mais central na análise de grandes quantidades de dados.
Este curso vai-se focar nos principais algoritmos desenvolvido para responder a tarefas bioinformáticas. Será dado ênfase em algoritmos de processamento e análise de sequências, quer sejam sequências nucleotídicas (exemplo DNA ou RNA) ou sequências de aminoácidos (proteínas).
O objetivo deste curso é de que os estudantes sejam capazes de entender como funcionam estes algoritmos e como podem ser desenvolvidos e aplicados para responder a novos desafios computacionais na análise de sequências biológicas.
Resultados de aprendizagem e competências
No final deste curso é esperado do estudante que:
- Esteja familiarizado com os principais conceitos de Bioinformática incluindo os principais conceitos de biologia molecular computacional;
- Identificar as principais fontes e tipos de dados de sequências biológicas(e.g. sequências de nucleotídeos ou de aminoácidos; motifs e domínios) e como estes podem ser representados do ponto de vista computacional;
- Compreender os diferentes problemas relacionados com a análise de sequências e identificar os algoritmos e estruturas de dados mais adequados para resolver estes problemas.
- Identificar do ponto de vista algorítmico as vantagens e desvantagens de cada método. Ênfase será dada aos métodos para processamento básico de sequências, para transcrição e tradução de genes, para alinhamento pareado e múltiplo de sequências, para busca e identificação de padrões, análise filogenética a partir de sequências e grafos e redes biológicas.
- Ter uma perspectiva da Bioinformática como uma disciplina de importância crítica para alavancar a investigação na área da biologia, ciências biomédicas e da saúde; como um área de investigação com um rápido e constante desenvolvimento.
Modo de trabalho
Presencial
Programa
- Perspectiva geral sobre os conceitos fundamentais de Biologia Molecular;
- Introdução à linguagem de programação Python;
- Processamento básico de sequências biológicas;
- Busca de padrões em sequências;
- Alinhamento pareado de sequências;
- Pesquisa em base de dados de sequências similares;
- Alinhamento múltiplo de sequências;
- Clustering e árvores;
- Motifs probabílisticos;
- Grafos e redes biológicas.
Bibliografia Obrigatória
Miguel Rocha and Pedro G. Ferreira; Bioinformatics Algorithms(1st Edition): Design and Implementation in Python., Elsevier, 2018. ISBN: 9780128125205
Bibliografia Complementar
Neil C. Jones and Pavel A. Pevzner ; An Introduction to Bioinformatics Algorithms (Computational Molecular Biology) 1st Edition. . ISBN: 0262101068
Sebastian Bassi; Python for Bioinformatics, CRC Press, 2016
R. Durbin, S. Eddy, A. Krogh, G. Mitchison; iological Sequence Analysis: Probabilistic Models of Proteins and Nucleic Acids, Cambridge University Press, 1998
B. Alberts, A. Johnson, J. Lewis, M. Raff, K. Roberts, P. Walter; Molecular Biology of the Cell, 4th edition, Garland Science, 2002
The official home of the Python Programming Language; The python language website
Philip Guo; Python tutor, visualization of code execution
Dan Gusfield; Algorithms on Strings, Trees and Sequences: Computer Science and Computational Biology, Cambridge University Press, 1997
Python Software Foundation; The python tutorial
Stephen F. Altschul, Warren Gish, Webb Miller, Eugene W. Myers, David J. Lipman; Basic local alignment search tool, Journal of Molecular Biology 215 (3) (1990) 403–410.
Stephen F. Altschul, Thomas L. Madden, Alejandro A. Schäffer, Jinghui Zhang, Zheng Zhang, Webb Miller, David J. Lipman; Gapped blast and psi-blast: a new generation of protein database search programs, Nucleic Acids Research 25 (17) (1997) 3389–3402.
T.L. Bailey, C. Elkan; itting a mixture model by expectation maximization to discover motifs in biopolymers, Proceedings. International Conference on Intelligent Systems for Molecular Biology 2 (1994) 28–36.
Robert S. Boyer, J. Strother Moore; A fast string searching algorithm, Communications of the ACM 20 (10) (October 1977) 762–772.
Humberto Carrillo, David Lipman; The multiple sequence alignment problem in biology, SIAM Journal on Applied Mathematics 48 (5) (1988) 1073–1082.
M.K. Das, H.K. Dai; A survey of DNA motif finding algorithms, BMC Bioinformatics 8 (Suppl 7) (Nov 2007) S21.
Desmond G. Higgins, Paul M. Sharp; Clustal: a package for performing multiple sequence alignment on a microcomputer, Gene 73 (1) (1988) 237–244.
P. D’haeseleer; What are DNA sequence motifs? Nature Biotechnology 24 (4) (Apr 2006) 423–425.
Métodos de ensino e atividades de aprendizagem
- Aulas teóricas: exposição de matéria acompanhada de exemplos
- Aulas práticas: implementação (em Python) de algoritmos e trabalhos práticos de suporte.
COVID-19: Atividades Letivas à Distância
As aulas irão prosseguir à distância e online nos seguintes modos:
- Serão disponibilizados vídeos gravados previamente através da plataforma Moodle.
- Iremos manter a dinâmica dos exercícios para cada aula/tópico, que deverão ser submetidos na respetiva data limite.
- Vamos ter sessões online para esclarecimento de dúvidas. Durante estas sessões os alunos podem levantar dúvidas relativamente ao material das aulas. Notem que o critério de participação em aula continua a fazer parte da avaliação. É importante uma participação ativa nestas sessões.
- A sessão online de dúvidas será realizada Segunda-feira e Quarta-feira das 17:00 às 17:40. Poderá aceder a esta sessão pelo Colibri/Zoom usando o seguinte link: https://videoconf-colibri.zoom.us/j/8109672239
Software
Python3
Tipo de avaliação
Avaliação distribuída com exame final
Componentes de Avaliação
Designação |
Peso (%) |
Exame |
60,00 |
Participação presencial |
5,00 |
Trabalho prático ou de projeto |
35,00 |
Total: |
100,00 |
Componentes de Ocupação
Designação |
Tempo (Horas) |
Estudo autónomo |
120,00 |
Frequência das aulas |
42,00 |
Total: |
162,00 |
Obtenção de frequência
Será necessária uma nota mínima de 8 nas componentes de avaliação de exame, teste intermédio e trabalhos práticos.
Fórmula de cálculo da classificação final
Critério de avaliação:
A nota da UC será determinada pelo aproveitamento satisfatório (notas mínimas) nos trabalhos práticos, teste intermédio, exame e participação nas aulas. A contribuição de cada componente para a nota final será:
S: Trabalhos: 35% (trabalhos práticos de aula). Este trabalhos serão realizados em grupos de 2 estudantes e deverão ser submetidos após aula.
T: Teste intermédioP: Participação nas aulas: 5%
E: Exame final: 60%
Nota Final = S x 0. 35 + 0.05 x P + 0.6 x EA componente
E é melhorável. As componentes
P e
S não são melhoráveis.
Observações
O exame será realizado em modo presencial.