Saltar para:
Logótipo
Você está em: Início > M4121
Mapa das Instalações
FC6 - Departamento de Ciência de Computadores FC5 - Edifício Central FC4 - Departamento de Biologia FC3 - Departamento de Física e Astronomia e Departamento GAOT FC2 - Departamento de Química e Bioquímica FC1 - Departamento de Matemática

Métodos Estatísticos em Data Mining

Código: M4121     Sigla: M4121

Áreas Científicas
Classificação Área Científica
CNAEF Matemática e estatística

Ocorrência: 2020/2021 - 2S Ícone do Moodle

Ativa? Sim
Página Web: http://moodle.up.pt/course/view.php?id=150
Unidade Responsável: Departamento de Matemática
Curso/CE Responsável: Estatística Computacional e Análise de Dados

Ciclos de Estudo/Cursos

Sigla Nº de Estudantes Plano de Estudos Anos Curriculares Créditos UCN Créditos ECTS Horas de Contacto Horas Totais
E:ECAD 14 PE_Estatística Computacional e Análise de Dados 1 - 6 42 162

Língua de trabalho

Português

Objetivos

Introduzir os conceitos e métodos fundamentais de classificação supervisionada e não supervisionada.

Resultados de aprendizagem e competências

O estudante deverá ser capaz de:

 - reconhecer diferentes problemas de classificação não supervisionada e classificação supervisionada e de os resolver empregando os métodos abordados e com recurso ao software R.

- preparar, resolver e apresentar projetos computacionais de data mining, onde os vários modelos apresentados são discutidos, avaliados e comparados perante casos concretos.

- resolver exercícios computacionais e não computacionais sobre as metodologias abordadas.

 

Modo de trabalho

Presencial

Programa

 

Introdução e formulação de um problema de classificação supervisionada e não supervisionada; alguns exemplos de aplicação. Breve resumo de vetores aleatórios. Distribuição normal multivariada. Análise em componentes principais (ACP). Análise Classificatória: métodos hierárquicos e não hierárquicos. Teoria da decisão estatística. Análise discriminante linear e quadrática. Regressão logística. Árvores de decisão e de regressão; poda custo-complexidade. Redes Neuronais. Estimação não paramétrica de funções densidade de probabilidade: método do núcleo e dos K vizinhos mais próximos. Desenvolvimentos recentes do método do núcleo: máquinas de vetores de suporte.

 

Bibliografia Obrigatória

000040415. ISBN: 0-471-05669-3
000040365. ISBN: 0-387-95284-5
Hand David 1950-; Principles of data mining. ISBN: 9780262082907 hbk

Métodos de ensino e atividades de aprendizagem

As aulas são acompanhadas por material disponibilizado pelo docente, incluindo fichas de exercícios referentes a cada uma das secções programáticas, e ainda pela utilização de Software de Estatística, em computador.

Software

Software R

Tipo de avaliação

Avaliação distribuída com exame final

Componentes de Avaliação

Designação Peso (%)
Exame 40,00
Trabalho escrito 60,00
Total: 100,00

Componentes de Ocupação

Designação Tempo (Horas)
Estudo autónomo 120,00
Frequência das aulas 42,00
Total: 162,00

Obtenção de frequência

Pelo menos 30% em cada um dos trabalhos.

Fórmula de cálculo da classificação final

Exame final e projectos.  O exame tem um peso de 40% e os trabalho de 60%. O aluno tem de tirar pelo menos 30% do valor de cada uma das componentes e positiva na nota global.

Recomendar Página Voltar ao Topo
Copyright 1996-2024 © Faculdade de Ciências da Universidade do Porto  I Termos e Condições  I Acessibilidade  I Índice A-Z  I Livro de Visitas
Página gerada em: 2024-09-01 às 06:28:29 | Política de Utilização Aceitável | Política de Proteção de Dados Pessoais | Denúncias