Modelação e Análise de Dados II
Áreas Científicas |
Classificação |
Área Científica |
OFICIAL |
Estudos de Gestão |
Ocorrência: 2022/2023 - 1S 
Ciclos de Estudo/Cursos
Língua de trabalho
Inglês
Objetivos
Desenvolver competências de elaboraração e utilização de projetos de extração de conhecimento.
Resultados de aprendizagem e competências
A elaboração de um projeto requer conhecer os vários tipos de tarefas de extração de conhecimento de dados (Data Mining), conhecer os principais métodos e algoritmos para cada tipo de tarefa, serem capazes de aplicar esses métodos a um novo problema de análise de dados, serem capazes de avaliar os resultados e compreender o funcionamento dos métodos estudados.Modo de trabalho
Presencial
Programa
- Conceitos básicos de aprendizagem automática
- Conhecimento: Generalização e especialização. Representação de conhecimento;
- Tipologia dos problemas de extração de conhecimento;
- Ferramentas de data mining.
- Análise Exploratória de Dados
- Coleção;
- Exploração Inicial dos Dados;
- Limpeza dos Dados;
- Visualização dos Data;
- Seleção dos Atributos;
- Valores extremos (outliers);
- Valores em falta;
- Análise Exploratória dos Dados;
- Visualização gráfica dos Dados;
- Modelação Preditiva
- Métodos baseados em distâncias: o algoritmo do k-NN;
- Métodos Probabilísticos: classificadores Bayesianos.
- Métodos baseados em Procura: árvores e regras de decisão. O algoritmo de cobertura.
- Métodos baseados em otimização: SVM e ANN;
- Avaliação de modelos de classificação e regressão: métricas, custos. análise ROC;
- Métodos de combinação de modelos;
- Pré-processamento: valores desconhecidos, discretização, outliers.
- Modelação descritiva:
- Análise de associação: conjuntos frequentes e regras de associação;
- Análise de agrupamentos.
- Conclusões finais
- Metodologias de projetos de data mining;
- Dimensão Ética no Data Mining.
Bibliografia Obrigatória
Ian H. Witten;
Data mining. ISBN: 1-55860-552-5
Jiawei Han;
Data mining. ISBN: 978-0-12-381479-1
Bibliografia Complementar
João Manuel Portela da Gama;
Extração de conhecimento de dados. ISBN: 978-972-618-914-5
Métodos de ensino e atividades de aprendizagem
O curso funciona em regime de Laboratório, baseado em módulos. A metodologia de ensino em cada módulo é estruturada do seguinte modo:
- descrição do problema financeiro a resolver;
- identificação com explicação dos métodos computacionais para a sua resolução;
- exercícios (sedimentação e exploração de conhecimentos).
Software
Jupyter
Python
R
Tipo de avaliação
Avaliação distribuída sem exame final
Componentes de Avaliação
Designação |
Peso (%) |
Apresentação/discussão de um trabalho científico |
20,00 |
Teste |
30,00 |
Trabalho prático ou de projeto |
50,00 |
Total: |
100,00 |
Componentes de Ocupação
Designação |
Tempo (Horas) |
Estudo autónomo |
60,00 |
Frequência das aulas |
42,00 |
Trabalho escrito |
20,00 |
Trabalho laboratorial |
40,00 |
Total: |
162,00 |
Obtenção de frequência
De acordo com o Regulamento Geral para a Avaliação dos discentes de primeiros ciclos
e de segundos ciclos da Faculdade de Economia da Universidade do Porto todos os estudantes inscritos tem frequência nas Unidades Curriculares. (artigo 10º ponto 5)
Fórmula de cálculo da classificação final
30% avaliação individual + 70% trabalho de grupo (2 trabalhos com o mesmo peso)