Código: | CC4018 | Sigla: | CC4018 | Nível: | 400 |
Áreas Científicas | |
---|---|
Classificação | Área Científica |
OFICIAL | Ciência de Computadores |
Ativa? | Sim |
Unidade Responsável: | Departamento de Ciência de Computadores |
Curso/CE Responsável: | Mestrado em Ciência de Computadores |
Sigla | Nº de Estudantes | Plano de Estudos | Anos Curriculares | Créditos UCN | Créditos ECTS | Horas de Contacto | Horas Totais |
---|---|---|---|---|---|---|---|
M:A_ASTR | 8 | Plano de Estudos oficial desde_2013/14 | 1 | - | 6 | 42 | 162 |
2 | |||||||
M:CC | 25 | PE a partir do ano letivo de 2014 | 1 | - | 6 | 42 | 162 |
M:ERSI | 10 | Plano Oficial a partir de 2021_M:ERSI | 1 | - | 6 | 42 | 162 |
Esta disciplina tem como objetivos principais fazer uma introdução às principais metodologias de data science, e também fornecer conhecimentos sobre programação e sistemas utilizados para a análise de dados, tais como a linguagem R.
Pretende-se que os(as) alunos(as):
1. adquiram competências teóricas sobre metodologias de data science,
2. adquiram competências de desenvolvimento de software para tarefas de data science,
3. adquiram competências sobre a aplicação do data science a problemas concretos.
1. Introdução ao Data Science
• A metodologia CRISP-DM
• Dados, modelos e padrões
• Tarefas de data mining
2. Técnicas de Pré-processamento de dados
• Importação de dados
• Limpeza de dados
• Transformar e criar novas variáveis
• Redução de dimensionalidade
3. Exploração e visualização de dados
• Sumariação de dados
• Visualização de dados
4. Modelos descritivos
• Métodos de agrupamento: métodos de partições, métodos hierárquicos
5. Modelos de previsão
• Problemas de classificação e regressão
• Métricas de avaliação
• Modelos matemáticos: regressão linear, Naive Bayes, k vizinhos mais próximos
• Árvores de decisão: árvores de classificação, árvores de regressão, métodos de pruning
• Redes neuronais e deep learning
• Máquinas de suporte vectorial
• Ensembles: Bagging, Random Forests, Boosting, AdaBoost, Xgboost
6. Metodologias de avaliação / comparação de modelos
• Medidas de avaliação
• Métodos de obtenção de estimativas
• Métodos de comparação / testes de significância
Nas aulas é usado o método expositivo, sendo apresentada uma visão organizada dos temas do programa, bem como exemplos práticos de aplicação dos mesmos.
Designação | Peso (%) |
---|---|
Teste | 35,00 |
Trabalho prático ou de projeto | 30,00 |
Exame | 35,00 |
Total: | 100,00 |
Designação | Tempo (Horas) |
---|---|
Elaboração de projeto | 35,00 |
Estudo autónomo | 84,00 |
Apresentação/discussão de um trabalho científico | 1,00 |
Frequência das aulas | 42,00 |
Total: | 162,00 |
O trabalho prático é obrigatório com uma nota mínima de 30%.
A avaliação da disciplina é distribuída, composta por um teste intercalar durante o semestre, um exame final e um trabalho prático no final do semestre.
O cálculo da classificação final é feito pela média pesada das notas práticas e teóricas através da fórmula:
NF = 0.35 * TI + 0.35 * Ex + 0.30 * TP
em que,
TI é a nota do Teste Intercalar,
Ex é a nota do Exame Final e
TP é a nota do Trabalho Prático.
Não obterão aprovação, os alunos que não obtiverem um mínimo de 30% em cada componente, isto é, 6 valores em 20.
O exame de recurso, será cotado para 70% (14 valores em 20) da nota final.
O teste intercalar terá lugar, a meio do semestre, durante as aulas.
O trabalho prático será anunciado a meio do semestre e deverá ser entregue no final do mesmo.
Os estudantes em regime especial de avaliação e que justifiquem a sua ausência podem realizar o teste intermédio em data e hora a combinar com o docente.
A avaliação do trabalhos prático não é passível de melhoria.
O estudante pode melhorar a nota teórica submetendo-se ao exame de recurso.