Sequenciação de Nova Geração
Áreas Científicas |
Classificação |
Área Científica |
OFICIAL |
Biologia |
Ocorrência: 2022/2023 - 1S
Ciclos de Estudo/Cursos
Língua de trabalho
Português - Suitable for English-speaking students
Objetivos
O objetivo deste curso é dotar os alunos de pós graduação de conhecimentos avançados sobre a análise de dados de NGS através da bioinformática e biologia computacional, tanto do ponto de vista teórico como prático. O curso é especialmente desenhado para ajudar os estudantes interessados em desenvolver as suas carreiras nas novas tecnologias de sequenciação para resolver problemas biológicos relacionados com proteínas, genes, genomas e respetivas interações.
Resultados de aprendizagem e competências
Adquisição de conhecimentos em:
Unix Command line e criação de pequenos scripts para modificação de ficheiros sem necessidade de os abrir.
Conhecimento de técnicas para a limpeza de leituras de sequenciação de terceira geração.
Domínio de técnicas de ensamblagem de leituras por mapeio e de novo.
Análise de dados de RNA-Seq e transcriptómica
Predição e localização de genes dentro de contigs e software utilizado.
Anotação funcional de proteínas.
Modo de trabalho
Presencial
Pré-requisitos (conhecimentos prévios) e co-requisitos (conhecimentos simultâneos)
nenhum
Programa
I. Introdução ao NGS. Preparação de bibliotecas genomicas e sequenciação
Tecnologia e métodos por trás de cada plataforma NGS
II. Introdução aos truques de linha de comando. Aprender os principais comandos para se mover pelas pastas, criar, excluir, classificar, mover arquivos no sistema Unix.
Como se conectar a um servidor remoto para realizar uma análise maior. Transferência segura entre computadores
Exercícios com comandos no shell. Introdução ao editor de fluxo SED, opções e funcionalidades.
Exercícios aplicados com comando SED. Modificação de arquivo sem abri-lo.
Introdução ao editor de arquivos AWK. Exemplos, funções integradas e condições para aplicar aos arquivos de texto.
Exercícios
III. O que é ler dados, visualizá-los e analisar os índices de qualidade. Visão geral sobre como sequenciar os efeitos de erro:
- Mapeamento de reads,
- Detecção variantes,
- Reconstrução de haplótipos,
- Filogenias
- Mapeamento de novo
- Expressão diferencial.
Estudo de caso: mapeamento de algoritmos em detalhe.
Prática: detecção de variantes e evolução da resistência a drogas no HIV-1 usando leituras mapeadas.
Detecção de variantes após remoção do erro de seqüenciamento usando uma estrutura bayesiana.
Prática: aplicando o framework bayesiano.
IV. Novas formas de armazenar dados após a remoção de erros.
Novas formas de observar variações genéticas que não exigem mapeamento de leituras, por exemplo Modelos de Markov.
Montagem do transcriptoma vs mapeamento do genoma.
V. Três métodos de montagem do transcriptoma em detalhe (e qual o impacto dos erros de cada um deles):
- Referência baseada no genoma.
- Mapeamento de novo de mRNA.
- Uma abordagem híbrida.
Prática: pré-formando uma montagem usando a abordagem híbrida.
VI. O problema das quimeras após a montagem e como elas surgem (análise de rede).
Prática - removendo quimeras dos dados.
Expressão diferencial.
Experiências baseadas em leituras de leitura filtradas de qualidade.
VII. Webs e fóruns para discutir problemas com scripts.
Formato Fastq e significado das informações de conteúdo.
Pré-processamento pós-sequenciamento.
Filtros de qualidade aplicados a dados brutos e remoção de adaptadores.
Exercícios
IX. Previsão genética em procariontes e eucariontes. Bases da previsão
Predição baseada em métodos de homologia e
ab-initio (baseados em sinais).
Software disponível e exercícios.
X. Anotação funcional do gene.
Bases de dados de termos, metodologia e estratégias.
Software disponível e exercícios.
Bibliografia Obrigatória
Teresa K. Attwood;
Introduction to bioinformatics. ISBN: 0-582-32788-1
Bibliografia Complementar
Tore Samuelsson; Genomics and Bioinformatics, Cambridge University Press, 2012. ISBN: 9781139022095
Métodos de ensino e atividades de aprendizagem
Aulas presenciais
Atividades dirigidas e supervisadas pelos tutores.
Tarefas/exercicios de aplicação dos conhecimentos aquiridos
Palavras Chave
Ciências Naturais > Ciências biológicas > Biologia > Genética
Ciências Naturais > Ciências biológicas > Biologia > Biologia computacional
Ciências Naturais > Ciências biológicas > Biologia > Biologia molecular
Tipo de avaliação
Avaliação distribuída sem exame final
Componentes de Avaliação
Designação |
Peso (%) |
Trabalho prático ou de projeto |
90,00 |
Participação presencial |
10,00 |
Total: |
100,00 |
Componentes de Ocupação
Designação |
Tempo (Horas) |
Frequência das aulas |
22,00 |
Trabalho de investigação |
20,00 |
Total: |
42,00 |
Obtenção de frequência
Horas de presença do estudante dividido pelo numero total de horas do curso (frequencia ≥ 80%)
Fórmula de cálculo da classificação final
Soma das notas obtidas nos exercicios/tarefas individuais submetidos pelo aluno, dividido pelo numero total de exercicios/tarefas distribuidos.
Provas e trabalhos especiais
Um trabalho/exercicio prático por cada capitulo do programa
Trabalho de estágio/projeto
não
Avaliação especial (TE, DA, ...)
Um trabalho/exercicio prático por cada capitulo do programa.
Melhoria de classificação
Modulado de acordo com a presença nas aulas
Observações
N.A.