Saltar para:
Logótipo
Você está em: Início > M4114
Mapa das Instalações
FC6 - Departamento de Ciência de Computadores FC5 - Edifício Central FC4 - Departamento de Biologia FC3 - Departamento de Física e Astronomia e Departamento GAOT FC2 - Departamento de Química e Bioquímica FC1 - Departamento de Matemática

Estatística e Análise de Dados

Código: M4114     Sigla: M4114     Nível: 400

Áreas Científicas
Classificação Área Científica
OFICIAL Matemática

Ocorrência: 2021/2022 - 2S Ícone do Moodle

Ativa? Sim
Unidade Responsável: Departamento de Matemática
Curso/CE Responsável: Mestrado em Ciência de Dados (Data Science)

Ciclos de Estudo/Cursos

Sigla Nº de Estudantes Plano de Estudos Anos Curriculares Créditos UCN Créditos ECTS Horas de Contacto Horas Totais
M:DS 25 Plano Oficial a partir de 2018_M:DS 1 - 6 42 162
Mais informaçõesA ficha foi alterada no dia 2022-01-10.

Campos alterados: Tipo de avaliação

Língua de trabalho

Inglês

Objetivos

Formar os estudantes em métodos de análise multivariada de dados, de forma a permitir extrair a informação essencial 
de um conjunto potencialmente volumoso de dados, com foco em métodos de classificação supervisionada e não supervisionada.

 

Resultados de aprendizagem e competências

1. Comprensão dos fundamentos teóricos das metodologias lecionadas.

2. Capacidade de extrair a informação essencial de um conjunto de dados reais, usando as metodologias lecionadas

E em particular:
- Reconhecer diferentes problemas de classificação não supervisionada e classificação supervisionada e de os
resolver empregando os métodos abordados e com recurso ao software R ;
- Preparar, resolver e apresentar projetos computacionais de data mining, onde os vários modelos apresentados são discutidos, avaliados
e comparados perante casos concretos.
- Resolver exercícios computacionais e não computacionais sobre as metodologias abordadas

Modo de trabalho

Presencial

Pré-requisitos (conhecimentos prévios) e co-requisitos (conhecimentos simultâneos)

São necessários conhecimentos prévios sobre variáveis aleatórias e distribuições de probabilidade, estatísticas amostrais, intervalos de confiança e testes de hipóteses. Estes são os conteúdos usuais de uma unidade curricular de introdução às Probabilidades e Estatística do ensino superior. 

Programa

Breve resumo de vetores aleatórios. Distribuição normal multivariada. 
Métodos de reamostragem para a estimação da taxa de erro. Seleção de Modelos Lineares e Regularização (Regressão Ridge e Lasso); compromisso viés-variância. Triagem de variáveis para preditores de ultra elevada dimensão.
Análise Classificatória: métodos de partição, métodos hierárquicos; modelos de misturas e modelo probabilístico. Teoria da decisão estatística; regras de Bayes de erro mínimo e de custo mínimo.
Análise discriminante linear e quadrática. Regressão logística. Estimação não paramétrica de funções densidade de probabilidade: método do núcleo e dos K vizinhos mais próximos. Análise Factorial : Análise em Componentes Principais,
Análise Factorial das Correspondências simples e Múltiplas-. Escalonamento Multidimensional.



Bibliografia Obrigatória

apontamentos escritos disponibilizados pelos professores
James Gareth 070; An introduction to statistical learning. ISBN: 978-1-4614-7137-0
Everitt Brian S.; Applied multivariate data analysis. ISBN: 978-0-470-71117-0
000040365. ISBN: 0-387-95284-5

Bibliografia Complementar

000098707. ISBN: 978-0-521-86116-8
Sharma, Subhash; Applied multivariate techniques. ISBN: 0-471-31064-6
Hair Jr Joseph F.; Multivariate data analysis. ISBN: 0-13-515309-3
Jianqing Fan and Runze Li and Cun-Hui Zhang ; Statistical Foundation of Data Science , Chapman and Hall/CRC; 1 edition, 2019. ISBN: 978-1466510845

Métodos de ensino e atividades de aprendizagem

Aulas de tipo teórico-prático com diferentes exemplos de aplicação das técnicas e modelos estatísticos apresentados em laboratório computacional.O software usado é o software SPSS ou a linguagem gratuita de programação com ambiente de software R (dependendo do mestrado em causa).

Software

R Project

Palavras Chave

Ciências Físicas > Matemática > Estatística

Tipo de avaliação

Avaliação distribuída com exame final

Componentes de Avaliação

Designação Peso (%)
Teste 60,00
Trabalho escrito 40,00
Total: 100,00

Componentes de Ocupação

Designação Tempo (Horas)
Estudo autónomo 120,00
Frequência das aulas 42,00
Total: 162,00

Obtenção de frequência

Não há falta de frequência às aulas. O trabalho computacional, que deverá ser apresentado pelos alunos, é obrigatório.

Fórmula de cálculo da classificação final

1. Há exame na época normal e na época de recurso.

2. Melhoria de nota: os alunos que se apresentem no exame de recurso para melhoria de nota têm de realizar ambas as partes. O trabalho  não pode ser melhorado.  

A disciplina divide-se em duas partes; Parte I correspondente a cerca de 2/3 das aulas e Parte II a 1/3. Cada parte é constituída por um trabalho e por um exame. Para cada aluno as notas dos trabalhos e exames são dadas por:

Nota_dos_trabalhos : max (2/3*Tr1 +1/3*Tr2, 1/2*Tr1+1/2*Tr2)

Nota_dos_exames:       max (2/3*Exame1 +1/3*Exame2, 1/2*Exame1+1/2*Exame2)

Nota final= 0.6*Nota_dos_exames+0.4*Nota_dos_trabalhos. A mesma fórmula se aplica às duas partes do exame de Recurso.





A aprovação está condicionada à Nota_dos_Exames ser igual ou 
superior a 7.0 valores (na escala de 0 a 20). Os trabalhos práticos consistem na análise de uma base de dados
reais, utilizando os métodos lecionados na disciplina, por
recurso a software. Deverá ser realizado por grupos de 2 alunos.

Melhoria de classificação

 Melhoria de nota: os alunos que se apresentem no exame de recurso para melhoria de nota têm de realizar ambas as partes. O trabalho não pode ser melhorado.  A fórmula de avaliação é a mesma (ver acima).

Recomendar Página Voltar ao Topo
Copyright 1996-2025 © Faculdade de Ciências da Universidade do Porto  I Termos e Condições  I Acessibilidade  I Índice A-Z  I Livro de Visitas
Página gerada em: 2025-06-15 às 00:36:02 | Política de Utilização Aceitável | Política de Proteção de Dados Pessoais | Denúncias