Código: | CC4018 | Sigla: | CC4018 | Nível: | 400 |
Áreas Científicas | |
---|---|
Classificação | Área Científica |
OFICIAL | Ciência de Computadores |
Ativa? | Sim |
Página Web: | http://www.dcc.fc.up.pt/~ines/aulas/1516/DM1/DM1.html |
Unidade Responsável: | Departamento de Ciência de Computadores |
Curso/CE Responsável: | Mestrado em Ciência de Computadores |
Sigla | Nº de Estudantes | Plano de Estudos | Anos Curriculares | Créditos UCN | Créditos ECTS | Horas de Contacto | Horas Totais |
---|---|---|---|---|---|---|---|
M:AST | 7 | Plano de Estudos oficial desde_2013/14 | 1 | - | 6 | 42 | 162 |
2 | |||||||
M:CC | 12 | PE a partir do ano letivo de 2014 | 1 | - | 6 | 42 | 162 |
MI:ERS | 29 | Plano Oficial desde ano letivo 2014 | 4 | - | 6 | 42 | 162 |
M:SI | 5 | Plano de estudos a partir de 2014/2015 | 1 | - | 6 | 42 | 162 |
Esta disciplina tem como objetivos principais fazer uma introdução às principais metodologias de data mining, e também fornecer conhecimentos sobre programação e sistemas utilizados para a análise de dados tais como a linguagem R e o pacote WEKA.
Pretende-se que os(as) alunos(as):
1. adquiram competências teóricas sobre metodologias de data mining,
2. adquiram competências de desenvolvimento de software para tarefas de data mining,
3. adquiram competências sobre a aplicação do data mining a problemas concretos.
1. Introdução ao Data Mining
• Dados, modelos e padrões
• Tarefas de data mining
• Introdução ao processo de data mining
2. Exploração e visualização de dados
• Sumariação de dados
• Visualização de dados
3. Modelos descritivos
• Métodos de agrupamento
- Métodos de partições
- Métodos hierárquicos
• Detecção de casos raros
4. Modelos de previsão
• Problemas de classicação e regressão
• Modelos matemáticos
- Regressão linear
- Naive Bayes
- k Vizinhos mais próximos
• Modelos baseados em regras
- Aprendizagem como procura
• Árvores de decisão
- Árvores de classicação
- Árvores de regressão
- Métodos de pruning
• Redes neuronais
• Máquinas de suporte vectorial
• Ensembles
- Bagging
- Boosting, AdaBoost
5. Metodologias de avaliação/comparação de modelos
• Medidas de avaliação
• Métodos de obtenção de estimativas
• Métodos de comparação / testes de signicância
Nas aulas é usado o método expositivo, sendo apresentada uma visão organizada dos temas do programa, bem como exemplos práticos de aplicação dos mesmos.
Designação | Peso (%) |
---|---|
Teste | 60,00 |
Trabalho escrito | 40,00 |
Total: | 100,00 |
Para a obtenção da frequência os estudantes deverão participar ou nos dois testes teóricos previstos na unidade curricular ou no exame final constituído por duas partes referentes aos conteúdos do teste 1 e do teste2.
A avaliação da disciplina é distribuída, com exame final, composta por dois (2) testes teóricos durante o semestre, um trabalho escrito e de apresentação (1) e um trabalho prático no final do semestre (1).
O cálculo da classificação final é feito pela média pesada das notas práticas e teóricas através da fórmula:
NF = 0.60 * NTeórica + 0.40 * NPrática
em que,
NTéorica é a média das notas nos dois testes teóricos e
NPrática é dada pela realização dos dois trabalhos.
Haverá dois testes durante o semestre (T1 e T2). Estes não são obrigatórios, mas quem obtiver nota mínima em cada teste e trabalhos e tiver a média NF positiva (above 9.5), não precisa ir fazer o exame final.
Minimum grade T1: 30%
MInimum grade T2: 30%
Minimum grade Assignment 1: 30%
Minimum grade Assignment 1: 30%
Os testes teóricos terão lugar durante duas aulas teóricas, a meio do semestre e no final do mesmo.
Os trabalhos práticos serão anunciados a meio do semestre e deverá ser entregue no final do mesmo.
Os estudantes em regime especial de avaliação, bem como alunos que justifiquem a sua ausência podem realizar os testes teóricos em data e hora a combinar com o docente.
O estudante pode melhorar qualquer das partes (T1, T2, Exame ou trabalhos).