| Código: | 2MADSAD01 | Sigla: | ECD I |
| Áreas Científicas | |
|---|---|
| Classificação | Área Científica |
| OFICIAL | Tecnologia da Informação |
| Ativa? | Sim |
| Página Web: | http://moodle.up.pt/course/view.php?id=480 |
| Unidade Responsável: | Agrupamento Científico de Matemática e Sistemas de Informação |
| Curso/CE Responsável: | Mestrado em Modelação, Análise de Dados e Sistemas de Apoio à Decisão |
| Sigla | Nº de Estudantes | Plano de Estudos | Anos Curriculares | Créditos UCN | Créditos ECTS | Horas de Contacto | Horas Totais |
|---|---|---|---|---|---|---|---|
| MADSAD | 33 | Plano Oficial de Bolonha | 1 | - | 7,5 | 56 | 202,5 |
| ME | 4 | Plano de estudos | 1 | - | 7,5 | 56 | 202,5 |
No final do semestre os alunos deverão conhecer os vários tipos de tarefas de extracção de conhecimento de dados (Data Mining), conhecer os principais métodos/algoritmos para cada tipo de tarefa, serem capazes de aplicar esses métodos a um novo problema de análise de dados, serem capazes de avaliar os resultados e compreender o funcionamento dos métodos estudados.
Conhecimento de vários tipos de tarefas de extracção de conhecimento de dados (Data Mining), conhecimento de principais métodos/algoritmos para cada tipo de tarefa; capacidade de aplicar esses métodos a um novo problema de análise de dados e de avaliar os resultados e compreender o funcionamento dos métodos estudados.
- Aprendizagem automática, data mining - Desde o OLTP ao OLAP. Bases de dados multidimensionais. - Conhecimento: Representação de conhecimento. Generalização e especialização. - Dados: Exemplos e instâncias de conceitos. Atributos e valores. Ruído e sinal. Representações multi-relacionais. Tipos de atributos. Formatos de dados para sistemas de data mining. Análise exploratória dos dados. - Métodos baseados em distâncias: o algoritmo do k-NN, propriedades. - Métodos Probabilisticos: classificadores Bayesianos. - Métodos baseados em Procura: arvores de decisão e regras de decisão. O algoritmo de cobertura. - Avaliação de modelos de classificação. Custos. Sobre-ajustamento. - Pre-processamento: valores desconhecidos, outliers. - Tópicos avançados em classificação. - Regressão. Avaliação de modelos de regressão. Séries temporais. - Padrões frequentes, regras de associação. - Análise de agrupamentos. - Métodos de Combinação de modelos. Métodos de votação, métodos baseados em amostragem, Combinação hierarquica de modelos. Ferramentas de data mining. - Metodologias de projectos de data mining (CRISP-DM)
Aulas teórico-praticas
| Designação | Peso (%) |
|---|---|
| Exame | 50,00 |
| Participação presencial | 0,00 |
| Trabalho escrito | 50,00 |
| Total: | 100,00 |
Exame: 50% Trabalhos: 50% - a nota dos trabalhos é a média dos trabalhos realizados - um trabalho não entregue conta como 0 - o exame tem nota mínima de 6,5 - os trabalhos têm nota mínima de 6,5