Introdução à Ciência de Dados
| Áreas Científicas |
| Classificação |
Área Científica |
| OFICIAL |
Engenharia Informática |
| OFICIAL |
Ciência de Computadores |
Ocorrência: 2025/2026 - 1S 
Ciclos de Estudo/Cursos
| Sigla |
Nº de Estudantes |
Plano de Estudos |
Anos Curriculares |
Créditos UCN |
Créditos ECTS |
Horas de Contacto |
Horas Totais |
| M.IA |
29 |
Plano de estudos oficial |
1 |
- |
6 |
42 |
162 |
Docência - Responsabilidades
Língua de trabalho
Português - Suitable for English-speaking students
Objetivos
Esta disciplina tem como objetivos principais fazer uma introdução às principais metodologias de data science, e também fornecer conhecimentos sobre programação e sistemas utilizados para o processamento e a análise de dados, tais como a linguagem Python.
Resultados de aprendizagem e competências
Pretende-se que os(as) alunos(as):
1. adquiram competências teóricas sobre metodologias de data science,
2. adquiram competências de desenvolvimento de software para tarefas de data science,
3. adquiram competências sobre a aplicação de metodologias de data science a problemas concretos.
Modo de trabalho
Presencial
Programa
1. Introdução à Ciência de Dados
• A metodologia CRISP-DM
• Dados, modelos e padrões
• Tarefas de data mining
2. Técnicas de Pré-processamento de dados
• Importação de dados
• Limpeza de dados
• Transformação e criação de novas variáveis
• Redução de dimensionalidade
3. Exploração e visualização de dados
• Sumariação de dados
• Visualização de dados
4. Modelos descritivos
• Métodos de agrupamento: métodos de partições, métodos hierárquicos
• Métodos de associação: regras
5. Modelos de previsão
• Problemas de classificação e regressão
• Métricas de avaliação
• Modelos matemáticos: regressão linear, Naive Bayes, k vizinhos mais próximos
• Árvores de decisão: árvores de classificação, árvores de regressão, métodos de pruning
• Redes neuronais e deep learning
• Máquinas de suporte vectorial
• Ensembles: Bagging, Random Forests, Boosting, AdaBoost, Xgboost
6. Metodologias de avaliação / comparação de modelos
• Medidas de avaliação
• Métodos de obtenção de estimativas
• Métodos de comparação / testes de significância
Bibliografia Obrigatória
Pang-Ning Tan;
Introduction to data mining. ISBN: 9780321420527
Charu C. Aggarwal;
Data mining. ISBN: 978-3-319-14142-8
Jiawei Han;
Data mining. ISBN: 978-0-12-381479-1
Bibliografia Complementar
Peter Flach;
Machine learning. ISBN: 978-1-107-42222-3
Andriy Burkov; The Hundred-Page Machine Learning Book, 2019. ISBN: 978-1999579500
Torgo Luís;
Data mining with R. ISBN: 978-1-4398-1018-7
Métodos de ensino e atividades de aprendizagem
Nas aulas é usado o método expositivo, sendo apresentada uma visão organizada dos temas do programa, bem como exemplos práticos de aplicação dos mesmos.
Palavras Chave
Ciências Tecnológicas > Tecnologia > Tecnologia da informação
Ciências Físicas > Ciência de computadores > Ferramentas de modelação
Ciências Físicas > Ciência de computadores > Informática > Informática aplicada
Ciências Tecnológicas > Tecnologia > Tecnologia de computadores > Tecnologia de software
Tipo de avaliação
Avaliação distribuída com exame final
Componentes de Avaliação
| Designação |
Peso (%) |
| Exame |
70,00 |
| Apresentação/discussão de um trabalho científico |
30,00 |
| Total: |
100,00 |
Componentes de Ocupação
| Designação |
Tempo (Horas) |
| Estudo autónomo |
84,00 |
| Apresentação/discussão de um trabalho científico |
36,00 |
| Frequência das aulas |
42,00 |
| Total: |
162,00 |
Obtenção de frequência
Fórmula de cálculo da classificação final
A avaliação da disciplina é composta por um exame final e um trabalho prático no final do semestre. O trabalho será avaliado através de apresentação oral.
O cálculo da classificação final é feito pela média pesada das notas práticas e teóricas através da fórmula:
NF = 0.7 * Exame + 0.3 * Trabalho
Provas e trabalhos especiais
O trabalho prático será anunciado no início do semestre e deverá ser entregue no final do mesmo.
Avaliação especial (TE, DA, ...)
A avaliação da época especial será feita nos mesmos moldes da avaliação contínua, com exame final. O estudante fará o exame valendo 70%. Poderá ou não apresentar um trabalho se quiser completar os restantes 30%. O trabalho deverá ser entregue e apresentado no período do calendário estipulado para a época especial.
Melhoria de classificação
A avaliação do trabalhos prático não é passível de melhoria.
O estudante pode melhorar a nota teórica submetendo-se ao exame da época de recurso.
Observações
Todo o material disponibilizado (slides, livros recomendados, etc.) é na língua Inglesa e no caso de existirem estudantes estrangeiros, as próprias aulas serão em Inglês.
O material da disciplina será disponibilizado na página correspondente no Moodle.