Código: | M4063 | Sigla: | M4063 |
Áreas Científicas | |
---|---|
Classificação | Área Científica |
OFICIAL | Matemática |
Ativa? | Sim |
Página Web: | http://moodle.up.pt/course/view.php?id=150 |
Unidade Responsável: | Departamento de Matemática |
Curso/CE Responsável: | Mestrado em Engenharia Matemática |
Sigla | Nº de Estudantes | Plano de Estudos | Anos Curriculares | Créditos UCN | Créditos ECTS | Horas de Contacto | Horas Totais |
---|---|---|---|---|---|---|---|
M:A_ASTR | 5 | Plano de estudos a partir do ano letivo 2023/2024 | 1 | - | 6 | 48 | 162 |
2 | |||||||
M:CC | 2 | PE a partir do ano letivo de 2014 | 1 | - | 6 | 48 | 162 |
M:EGEO | 0 | Plano de Estudos Oficial | 1 | - | 6 | 48 | 162 |
M:ENM | 5 | Plano de Estudos Oficial a partir de 2023/2024 | 1 | - | 6 | 48 | 162 |
2 | |||||||
M:M | 0 | Plano Oficial do ano letivo 2021 | 2 | - | 6 | 48 | 162 |
Introduzir os conceitos e métodos fundamentais de classificação supervisionada e não supervisionada.
O estudante deverá ser capaz de:
- reconhecer diferentes problemas de classificação não supervisionada e classificação supervisionada e de os resolver empregando os métodos abordados e com recurso ao software R.
- preparar, resolver e apresentar projetos computacionais de data mining, onde os vários modelos apresentados são discutidos, avaliados e comparados perante casos concretos.
- resolver exercícios computacionais e não computacionais sobre as metodologias abordadas.
Introdução e formulação de um problema de classificação supervisionada e não supervisionada; alguns exemplos de aplicação. Breve resumo de vetores aleatórios. Distribuição normal multivariada. Análise em componentes principais (ACP). Análise Classificatória: métodos hierárquicos e não hierárquicos. Teoria da decisão estatística. Análise discriminante linear e quadrática. Regressão logística. Árvores de decisão e de regressão; poda custo-complexidade. Referência a Random Forests, Bagging e Boosting. Redes Neuronais. Estimação não paramétrica de funções densidade de probabilidade: método do núcleo e dos K vizinhos mais próximos. Desenvolvimentos recentes do método do núcleo: máquinas de vetores de suporte.
As aulas são acompanhadas por material disponibilizado pelo docente, incluindo fichas de exercícios referentes a cada uma das secções programáticas, e ainda pela utilização de Software de Estatística, em computador.
Designação | Peso (%) |
---|---|
Exame | 40,00 |
Trabalho escrito | 60,00 |
Total: | 100,00 |
Designação | Tempo (Horas) |
---|---|
Estudo autónomo | 120,00 |
Frequência das aulas | 42,00 |
Total: | 162,00 |
Exame final e projectos. O exame tem um peso de 40% e os trabalho de 60%. O aluno tem de tirar pelo menos 35% do valor de cada uma das componentes e positiva na nota global. A aprovação está condicionada à Nota_dos_Exames ser igual ou superior a 7.0 valores (na escala de 0 a 20).
Os trabalhos práticos consistem na análise de uma base de dados
reais, utilizando os métodos lecionados na disciplina, por
recurso a software. Deverá ser realizado por grupos de 2 alunos.