Extração de Conhecimento de Dados I
Áreas Científicas |
Classificação |
Área Científica |
OFICIAL |
Tecnologia da Informação |
Ocorrência: 2017/2018 - 1S
Ciclos de Estudo/Cursos
Sigla |
Nº de Estudantes |
Plano de Estudos |
Anos Curriculares |
Créditos UCN |
Créditos ECTS |
Horas de Contacto |
Horas Totais |
MADSAD |
49 |
Plano Oficial de Bolonha |
1 |
- |
7,5 |
56 |
202,5 |
Docência - Responsabilidades
Língua de trabalho
Inglês
Objetivos
No final do semestre os alunos deverão conhecer os vários tipos de tarefas de extracção de conhecimento de dados (Data Mining), conhecer os principais métodos/algoritmos para cada tipo de tarefa, serem capazes de aplicar esses métodos a um novo problema de análise de dados, serem capazes de avaliar os resultados e compreender o funcionamento dos métodos estudados.
Resultados de aprendizagem e competências
Conhecimento de vários tipos de tarefas de extracção de conhecimento de dados (Data Mining), conhecimento de principais métodos/algoritmos para cada tipo de tarefa; capacidade de aplicar esses métodos a um novo problema de análise de dados e de avaliar os resultados e compreender o funcionamento dos métodos estudados.
Modo de trabalho
Presencial
Programa
- Aprendizagem automática, data mining - Desde o OLTP ao OLAP. Bases de dados multidimensionais. - Conhecimento: Representação de conhecimento. Generalização e especialização. - Dados: Exemplos e instâncias de conceitos. Atributos e valores. Ruído e sinal. Representações multi-relacionais. Tipos de atributos. Formatos de dados para sistemas de data mining. Análise exploratória dos dados. - Métodos baseados em distâncias: o algoritmo do k-NN, propriedades. - Métodos Probabilisticos: classificadores Bayesianos. - Métodos baseados em Procura: arvores de decisão e regras de decisão. O algoritmo de cobertura. - Avaliação de modelos de classificação. Custos. Sobre-ajustamento. - Pre-processamento: valores desconhecidos, outliers. - Tópicos avançados em classificação. - Regressão. Avaliação de modelos de regressão. Séries temporais. - Padrões frequentes, regras de associação. - Análise de agrupamentos. - Métodos de Combinação de modelos. Métodos de votação, métodos baseados em amostragem, Combinação hierarquica de modelos. Ferramentas de data mining. - Metodologias de projectos de data mining (CRISP-DM)
Bibliografia Obrigatória
J. Gama, A. Carvalho, K. Faceli, A. Lorena, M. Oliveira; Extração de Conhecimento de Dados, Silabo, 2012. ISBN: 978-972-618-698-4
Jiawei Han; Data Mining: Concepts and Techniques, Moegan Kaufman, 2006
Tom M. Mitchell; Machine learning, McGraw Hill, 1997
an Witten, Eibe Frank; Data Mining: practical machine learning tools and Techniques with java implementations, Morgan Kaufmann, 2000
David Hand, Heikki Mannila; Padhraic Smyth;Principles of Data Mining, MIT Press, 2001
Métodos de ensino e atividades de aprendizagem
Aulas teórico-praticas
Software
Weka -> http://www.cs.waikato.ac.nz/ml/weka/
R -> http://www.r-project.org/
Knime
Palavras Chave
Ciências Tecnológicas > Tecnologia > Tecnologia da informação
Ciências Físicas > Ciência de computadores > Cibernética > Inteligência artificial
Tipo de avaliação
Avaliação distribuída com exame final
Componentes de Avaliação
Designação |
Peso (%) |
Exame |
50,00 |
Participação presencial |
0,00 |
Trabalho escrito |
50,00 |
Total: |
100,00 |
Fórmula de cálculo da classificação final
Exame: 50% Trabalhos: 50% - a nota dos trabalhos é a média dos trabalhos realizados - um trabalho não entregue conta como 0 - o exame tem nota mínima de 6,5 - os trabalhos têm nota mínima de 6,5