Código: | M4114 | Sigla: | M4114 | Nível: | 400 |
Áreas Científicas | |
---|---|
Classificação | Área Científica |
OFICIAL | Matemática |
Ativa? | Sim |
Unidade Responsável: | Departamento de Matemática |
Curso/CE Responsável: | Mestrado em Ciência de Dados (Data Science) |
Sigla | Nº de Estudantes | Plano de Estudos | Anos Curriculares | Créditos UCN | Créditos ECTS | Horas de Contacto | Horas Totais |
---|---|---|---|---|---|---|---|
M:DS | 32 | Plano Oficial a partir de 2018_M:DS | 1 | - | 6 | 42 | 162 |
Docente | Responsabilidade |
---|---|
Joaquim Fernando Pinto da Costa | Regente |
Óscar António Louro Felgueiras | Regente |
Teorico-Prática: | 3,23 |
Tipo | Docente | Turmas | Horas |
---|---|---|---|
Teorico-Prática | Totais | 1 | 3,231 |
Óscar António Louro Felgueiras | 1,615 | ||
Joaquim Fernando Pinto da Costa | 1,615 |
Formar os estudantes em métodos de análise multivariada de dados, de forma a permitir extrair a informação essencial
de um conjunto potencialmente volumoso de dados, com foco em métodos de classificação supervisionada e não supervisionada.
1. Comprensão dos fundamentos teóricos das metodologias lecionadas.
2. Capacidade de extrair a informação essencial de um conjunto de dados reais, usando as metodologias lecionadas
E em particular:
- Reconhecer diferentes problemas de análise multivariada de dados e de os
resolver empregando os métodos abordados e com recurso ao software R ;
- Preparar, resolver e apresentar projetos computacionais de data mining, onde os vários modelos apresentados são discutidos, avaliados
e comparados perante casos concretos.
- Resolver exercícios computacionais e não computacionais sobre as metodologias abordadas
São necessários conhecimentos prévios sobre variáveis aleatórias e distribuições de probabilidade, estatísticas amostrais, intervalos de confiança e testes de hipóteses. Estes são os conteúdos usuais de uma unidade curricular de introdução às Probabilidades e Estatística do ensino superior.
Análise Preliminar de Dados.
Análise Factorial:
Análise em Componentes Principais;
Análise Factorial das Correspondências Simples;
Análise Factorial das Correspondências Múltiplas;
Escalonamento multidimensional.
Análise Classificatória:
Medidas de Comparação;
Classificação Hierárquica;
Classificação Não Hierárquica;
Classificação por Modelos de Mistura Finita
Análise Discriminante:
Análise Discriminante em 2 grupos;
Análise Discriminante em K grupos.
Árvores de Decisão.
Aulas de tipo teórico-prático com diferentes exemplos de aplicação das técnicas e modelos estatísticos apresentados em laboratório computacional. O software usado é a linguagem gratuita de programação com ambiente de software R .
Designação | Peso (%) |
---|---|
Trabalho prático ou de projeto | 40,00 |
Exame | 60,00 |
Total: | 100,00 |
Designação | Tempo (Horas) |
---|---|
Estudo autónomo | 80,00 |
Frequência das aulas | 42,00 |
Apresentação/discussão de um trabalho científico | 2,00 |
Trabalho escrito | 38,00 |
Total: | 162,00 |
1. Há exame na época normal e na época de recurso.
2. Melhoria de nota: os alunos podem melhorar a nota de exame em época de recurso. O trabalho não pode ser melhorado.
Nota final= 0.6*Nota_dos_exames+0.4*Nota_do_trabalho prático.
A mesma fórmula se aplica na Época de Recurso e Épocas Especiais.
O trabalho prático e a sua apresentação oral são obrigatórios, na época normal, época de recurso, e épocas especiais.
A aprovação está condicionada à Nota de exame ser igual ou
superior a 7.5 valores (na escala de 0 a 20).
O trabalhos prático consiste na análise de uma base de dados reais, utilizando os métodos lecionados na disciplina, por recurso a software.
Deverá ser realizado por grupos de 2 alunos.
Melhoria de nota: os alunos podem melhorar a nota de exame em época de recurso.
O trabalho prático não pode ser melhorado.
A fórmula de avaliação é a mesma emtodas as épocas (ver acima).