Extracção de Conhecimento e Aprendizagem Computacional
Áreas Científicas |
Classificação |
Área Científica |
OFICIAL |
Inteligência Artificial |
Ocorrência: 2014/2015 - 1S
Ciclos de Estudo/Cursos
Língua de trabalho
Português - Suitable for English-speaking students
Objetivos
Enquadramento
Após uma época em que as diferentes empresas/instituições muito investiram na recolha de dados no âmbito da informatização das suas operações, surge agora a necessidade de pôr esses dados ao serviço dessas empresas/instituições. O objetivo é ser capaz de extrair conhecimento desses dados que permita melhorar a eficiência e ganhar vantagem competitiva. É desta necessidade que surge a Unidade Curricular (UC) de Extração de Conhecimento e Aprendizagem Computacional (ECAC).
Objetivos
- Motivar para a utilização de técnicas de extração de conhecimento (EC) de dados, ou data mining, no apoio à decisão.
- Desenvolver a capacidade de utilizar corretamente essas técnicas para análise automática de grandes quantidades de dados.
Distribuição percentual
- Componente científica: 70%
- Componente tecnológica: 30%
Resultados de aprendizagem e competências
Pretende-se que os estudantes:
- Conheçam os vários tipos de tarefas de EC.
- Identifiquem problemas de apoio à decisão que possam ser representados como tarefas de EC.
- Conheçam as fases de um projecto de EC.
- Conheçam os principais métodos/algoritmos para cada tipo de tarefa de EC e compreendam o essencial do seu funcionamento.
- Apliquem esses métodos a problemas de apoio à decisão.
- Avaliem os resultados de um projeto de EC.
Modo de trabalho
Presencial
Pré-requisitos (conhecimentos prévios) e co-requisitos (conhecimentos simultâneos)
- Não sendo obrigatório ter frequentado nenhuma UC em concreto, é útil o estudante ter frequentado alguma UC de introdução à estatística.
- É também relevante que o estudante tenha conhecimentos elementares de algoritmia.
Programa
Data Mining descritivo
- Introdução à extracção de conhecimento (Data Mining).
- Clustering: Algoritmos de partição (revisão do K-means, K-medoids) e algoritmos hierárquicos. Outros algoritmos. Medidas de avaliação.
- Regras de associação: Algoritmo APRIORI. Outros algoritmos. Medidas de avaliação.
- Metodologias de Data Mining: Processo de extração de conhecimento. Metodologia CRISP-DM. Gestão de projetos.
- Pré-processamento de dados: Limpeza de dados e transformação de dados (normalização, redução e discretização).
Data Mining preditivo
- Avaliação de modelos preditivos: Revisão sobre árvores de decisão. Sobre-ajustamento em árvores de decisão. Metodologias de avaliação.
- Classificação: Algoritmos de classificação (métodos baseados em regras, distâncias e kernels; métodos Bayesianos). Questões comuns em classificação (distribuição de classes desequilibrada e custos). Medidas de avaliação.
- Regressão: Algoritmos de regressão (regressão linear e não linear, árvores de regressão, MARS). Medidas de avaliação.
Análise de Dados complexos
- Text mining: Representação de dados para text mining. Medidas de avaliação. - Web Mining e sistemas de recomendação.
Bibliografia Obrigatória
Jiawei Han, Micheline Kamber;
Data mining. ISBN: 1-55860-489-8
Bibliografia Complementar
Ian H. Witten, Eibe Frank;
Data mining. ISBN: 1-55860-552-5
Peter Flach; Machine Learning: The Art and Science of Algorithms that Make Sense of Data, Cambridge University Press, 2012. ISBN: 9781107422223 (http://www.cs.bris.ac.uk/~flach/mlbook/)
Mohammed Zaki and Wagner Meira Jr.; Data Mining and Analysis: Fundamental Concepts and Algorithms, Cambridge University Press, 2013. ISBN: 9780521766333 (http://www.dcc.ufmg.br/miningalgorithms/DokuWiki/doku.php)
Max Kuhn, Kjell Johnson; Applied Predictive Modeling, Springer New York, 2013. ISBN: 9781461468493
Métodos de ensino e atividades de aprendizagem
- Aulas teóricas para Exposição dos conceitos referidos.
- Sessões laboratoriais para aplicação prática dos conceitos aprendidos.
Software
RapidMiner 5
The R Project for Statistical Computing
Tipo de avaliação
Avaliação distribuída com exame final
Componentes de Avaliação
Designação |
Peso (%) |
Exame |
50,00 |
Participação presencial |
0,00 |
Trabalho laboratorial |
50,00 |
Total: |
100,00 |
Componentes de Ocupação
Designação |
Tempo (Horas) |
Estudo autónomo |
60,00 |
Frequência das aulas |
42,00 |
Trabalho laboratorial |
60,00 |
Total: |
162,00 |
Obtenção de frequência
A avaliação distribuída consiste na elaboração de um trabalho prático. No caso de falta a um dos momentos da avaliação distribuída, a nota atribuida é de 0 (zero) valores. Os trabalhadores estudantes e equivalentes dispensados das aulas devem, com periodicidade a combinar com os docentes, apresentar a evolução dos seus trabalhos, assim como devem fazer a apresentação destes, simultaneamente com os alunos ordinários
Fórmula de cálculo da classificação final
0.50* Nota do trabalho + 0.5 * Nota do exame
Provas e trabalhos especiais
O exame será realizado sem acesso a consulta.
O trabalho será elaborado em grupos de 2 estudantes e consiste na análise de um conjunto de dados e preparação de um apresentação que descreva e discuta tanto o projeto como os resultados obtidos.
Avaliação especial (TE, DA, ...)
Os alunos com estatuto que isenta da frequência das aulas têm que realizar o trabalho prático e ser sujeitos a exame.
Melhoria de classificação
A melhoria da avaliação distribuída só pode ser feita no ano seguinte.