Saltar para:
Logótipo
Você está em: Início > CC4018
Mapa das Instalações
FC6 - Departamento de Ciência de Computadores FC5 - Edifício Central FC4 - Departamento de Biologia FC3 - Departamento de Física e Astronomia e Departamento GAOT FC2 - Departamento de Química e Bioquímica FC1 - Departamento de Matemática

Data Mining I

Código: CC4018     Sigla: CC4018     Nível: 400

Áreas Científicas
Classificação Área Científica
OFICIAL Ciência de Computadores

Ocorrência: 2019/2020 - 1S Ícone do Moodle

Ativa? Sim
Página Web: https://www.dcc.fc.up.pt/~rpribeiro/aulas/DMI1920
Unidade Responsável: Departamento de Ciência de Computadores
Curso/CE Responsável: Mestrado em Ciência de Computadores

Ciclos de Estudo/Cursos

Sigla Nº de Estudantes Plano de Estudos Anos Curriculares Créditos UCN Créditos ECTS Horas de Contacto Horas Totais
M:A_ASTR 2 Plano de Estudos oficial desde_2013/14 1 - 6 42 162
2
M:CC 25 PE a partir do ano letivo de 2014 1 - 6 42 162
MI:ERS 25 Plano Oficial desde ano letivo 2014 4 - 6 42 162
M:SI 3 Plano de estudos a partir de 2014/2015 1 - 6 42 162

Língua de trabalho

Português - Suitable for English-speaking students

Objetivos

Esta disciplina tem como objetivos principais fazer uma introdução às principais metodologias de data science, e também fornecer conhecimentos sobre programação e sistemas utilizados para a análise de dados, tais como a linguagem R.

Resultados de aprendizagem e competências

Pretende-se que os(as) alunos(as): 
1. adquiram competências teóricas sobre metodologias de data science, 
2. adquiram competências de desenvolvimento de software para tarefas de data science, 
3. adquiram competências sobre a aplicação do data science a problemas concretos.

Modo de trabalho

Presencial

Programa

1. Introdução ao Data Science  
• A metodologia CRISP-DM 
• Dados, modelos e padrões
• Tarefas de data mining

2. Técnicas de Pré-processamento de dados
• Importação de dados
• Limpeza de dados 
• Transformar e criar novas variáveis
• Redução de dimensionalidade

3. Exploração e visualização de dados
• Sumariação de dados
• Visualização de dados

4. Modelos descritivos
• Métodos de agrupamento: métodos de partições, métodos hierárquicos

5. Modelos de previsão
• Problemas de classificação e regressão
• Métricas de avaliação 
• Modelos matemáticos: regressão linear, Naive Bayes, k vizinhos mais próximos
• Árvores de decisão: árvores de classificação, árvores de regressão, métodos de pruning
• Redes neuronais e deep learning
• Máquinas de suporte vectorial
• Ensembles: Bagging, Random Forests, Boosting, AdaBoost, Xgboost 

6. Metodologias de avaliação / comparação de modelos
• Medidas de avaliação
• Métodos de obtenção de estimativas
• Métodos de comparação / testes de significância


Bibliografia Obrigatória

Charu C. Aggarwal; Data Mining, the textbook, Springer, 2015. ISBN: 978-3-319-14141-1
Torgo Luís; Data mining with R. ISBN: 978-1-4398-1018-7
J. Han , M. Kamber and J. Pei ; Data Mining - Concepts and Techniques (3rd edition), 2011. ISBN: 9780123814791

Bibliografia Complementar

Peter Flach; Machine Learning, Cambridge University Press, 2012. ISBN: 978-1-107-42222-3
Andriy Burkov; The Hundred-Page Machine Learning Book, 2019. ISBN: 978-1999579500
000075501. ISBN: 9780262082907 hbk

Métodos de ensino e atividades de aprendizagem

Nas aulas é usado o método expositivo, sendo apresentada uma visão organizada dos temas do programa, bem como exemplos práticos de aplicação dos mesmos.

Software

Rstudio - IDE para o R
R - software para análise de dados

Palavras Chave

Ciências Tecnológicas > Tecnologia > Tecnologia da informação
Ciências Físicas > Ciência de computadores > Ferramentas de modelação
Ciências Físicas > Ciência de computadores > Informática > Informática aplicada
Ciências Tecnológicas > Tecnologia > Tecnologia de computadores > Tecnologia de software

Tipo de avaliação

Avaliação distribuída com exame final

Componentes de Avaliação

Designação Peso (%)
Teste 35,00
Trabalho prático ou de projeto 30,00
Exame 35,00
Total: 100,00

Componentes de Ocupação

Designação Tempo (Horas)
Elaboração de projeto 35,00
Estudo autónomo 84,00
Apresentação/discussão de um trabalho científico 1,00
Frequência das aulas 42,00
Total: 162,00

Obtenção de frequência

Os alunos que não obtiverem um mínimo de 30% (6 valores em 20), no teste intercalar, não poderão realizar o exame de época normal.

Todos os alunos poderão realizar o exame de recurso.


Fórmula de cálculo da classificação final

A avaliação da disciplina é distribuída, composta por um teste intercalar durante o semestre, um exame final e um trabalho prático no final do semestre.

O cálculo da classificação final é feito pela média pesada das notas práticas e teóricas através da fórmula:

NF = 0.35 * TI + 0.35 * Ex + 0.30 * TP 
em que,
TI é a nota do Teste Intercalar,
Ex é a nota do Exame Final e
TP é a nota do Trabalho Prático.

Não obterão aprovação, os alunos que não obtiverem um mínimo de 30% em cada componente, isto é, 6 valores em 20.

O exame de recurso, será cotado para 70% (14 valores em 20) da nota final.

Provas e trabalhos especiais

O teste intercalar terá lugar, a meio do semestre, durante as aulas teóricas.

O trabalho prático será anunciado a meio do semestre e deverá ser entregue no final do mesmo. 

Avaliação especial (TE, DA, ...)

Os estudantes em regime especial de avaliação e que justifiquem a sua ausência podem realizar o teste intermédio em data e hora a combinar com o docente.

Melhoria de classificação

A avaliação do trabalhos prático não é passível de melhoria.

O estudante pode melhorar a nota teórica submetendo-se ao exame de recurso.

Observações

Todo o material disponibilizado (slides, livros recomendados, etc.) é na língua Inglesa e no caso de existirem estudantes estrangeiros, as próprias aulas serão em Inglês.
Recomendar Página Voltar ao Topo
Copyright 1996-2025 © Faculdade de Ciências da Universidade do Porto  I Termos e Condições  I Acessibilidade  I Índice A-Z  I Livro de Visitas
Página gerada em: 2025-06-14 às 10:19:53 | Política de Utilização Aceitável | Política de Proteção de Dados Pessoais | Denúncias