Tópicos Avançados de Extração de Conhecimento e Aprendizagem Computacional
Áreas Científicas |
Classificação |
Área Científica |
OFICIAL |
Sistemas Inteligentes |
Ocorrência: 2022/2023 - 1S
Ciclos de Estudo/Cursos
Sigla |
Nº de Estudantes |
Plano de Estudos |
Anos Curriculares |
Créditos UCN |
Créditos ECTS |
Horas de Contacto |
Horas Totais |
PRODEI |
1 |
Plano de estudos Oficial |
1 |
- |
6 |
28 |
162 |
Língua de trabalho
Português - Suitable for English-speaking students
Objetivos
Enquadramento
Empresas e Instituições de Investigação Científica recolhem, hoje em dia, enormes quantidades de dados.
A análise desses dados pode ser uma mais-valia tanto em termos de vantagem competitiva (no caso das empresas) como fonte de novas descobertas (no caso da Investigação Científica).
Para grandes quantidades de dados ou para análises complexas baseadas em dados, os processos manuais ou mesmo técnicas de OLAP são proibitivas. Ferramentas informáticas, usando algoritmos de análise de dados (Estatística, Machine Learning, Data Mining, etc.), são necessárias para a construção [semi-]automática de modelos que auxiliem os decisores e investigadores a resolver problemas complexos com base nesses dados.
Objetivos
- Motivar para a utilização de técnicas de Extração de Conhecimento (EC) de dados, ou Data Mining, no apoio à decisão.
- Desenvolver a capacidade de utilizar corretamente essas técnicas para análise automática de grandes quantidades de dados.
- Familiarização com técnicas e tópicos avançados de EC.
Resultados de aprendizagem e competências
Pretende-se que os estudantes:
- Conheçam os vários tipos de tarefas de EC.
- Identifiquem problemas de apoio à decisão que possam ser representados como tarefas de EC.
- Conheçam as fases de um projeto de EC.
- Conheçam os principais métodos/algoritmos para cada tipo de tarefa de EC e compreendam o essencial do seu funcionamento. Será dada particular ênfase a algoritmos relacionais.
- Apliquem esses métodos a problemas de apoio à decisão.
- Avaliem os resultados de um projeto de EC.
Modo de trabalho
Presencial
Pré-requisitos (conhecimentos prévios) e co-requisitos (conhecimentos simultâneos)
Não sendo obrigatório ter frequentado nenhuma UC em concreto, é útil o estudante ter frequentado alguma UC de introdução à estatística e a UC de Extração de Conhecimento e Aprendizagem Computacional. É também relevante que o estudante tenha conhecimentos elementares de algoritmia.
Programa
- Introdução ao Data Mining
- Data Mining descritivo
- Data Mining preditivo
- Avaliação de modelos preditivos
- Meta-learning
- Visualização
- Text Mining
- Introdução do Data Mining multi-relacional
- Inductive Logic Programming
- Clustering relational
- Graph Mining
- Statistical Relational Learning
Bibliografia Obrigatória
Jiawei Han, Micheline Kamber;
Data mining. ISBN: 1-55860-489-8
Lavrac N., and Dzeroski S.; Inductive Logic Programming: Techniques and Applications, 1994. ISBN: 0134578708
Bibliografia Complementar
Ian H. Witten, Eibe Frank;
Data mining. ISBN: 1-55860-552-5
Peter Flach;
Machine Learning: The Art and Science of Algorithms that Make Sense of Data, Cambridge University Press, 2012. ISBN: 9781107422223 (http://www.cs.bris.ac.uk/~flach/mlbook/)
Mohammed Zaki and Wagner Meira Jr.;
Data Mining and Analysis: Fundamental Concepts and Algorithms, Cambridge University Press, 2013. ISBN: 9780521766333 (http://www.dcc.ufmg.br/miningalgorithms/DokuWiki/doku.php)
Max Kuhn, Kjell Johnson;
Applied Predictive Modeling, Springer New York, 2013. ISBN: 9781461468493
Jure Leskovec, Anand Rajaraman, Jeff Ullman;
Mining of Massive Datasets, 2014. ISBN: 978-1107077232
Vijay Kotu and Bala Deshpande; Data Science Concepts and Practice, Morgan Kaufmann, 2019. ISBN: 978-0-12-814761-0
Métodos de ensino e atividades de aprendizagem
Aulas teóricas para exposição dos conceitos referidos.
Sessões laboratoriais para aplicação prática dos conceitos aprendidos.
Software
Aleph ILP system
The R Project for Statistical Computing
RapidMiner 5
weka
Tipo de avaliação
Avaliação distribuída sem exame final
Componentes de Avaliação
Designação |
Peso (%) |
Trabalho laboratorial |
100,00 |
Total: |
100,00 |
Componentes de Ocupação
Designação |
Tempo (Horas) |
Estudo autónomo |
60,00 |
Frequência das aulas |
42,00 |
Trabalho laboratorial |
60,00 |
Total: |
162,00 |
Obtenção de frequência
A avaliação distribuída consiste na elaboração de um trabalho prático. Os trabalhadores estudantes e equivalentes dispensados das aulas devem, com periodicidade a combinar com os docentes, apresentar a evolução dos seus trabalhos, assim como devem fazer a apresentação destes, simultaneamente com os alunos ordinários.
Fórmula de cálculo da classificação final
Nota Final:
10% - Relatório perliminar
70% - Final project
20% - Avaliação dos seus pares
Provas e trabalhos especiais
O trabalho será elaborado individualmente e consiste na análise de um conjunto de dados, escrita de um relatório descrevendo o trabalho realizado e preparação de uma apresentação para a discussão oral do trabalho realizado.
O projeto terá os seguintes momentos de avaliação:
1. Relatório preliminar
2. Relatório Final
3. Apresentação Final
Além disso, cada aluno será chamado a avaliar dois outros projetos na forma de um breve relatório de avaliação e de perguntas que deverá colocar durante a apresentação dos seus colegas.
Avaliação especial (TE, DA, ...)
Todos os alunos (mesmo os que têm isenção de frequência das aulas) têm que realizar o trabalho prático.
Melhoria de classificação
A melhoria da avaliação distribuída só pode ser feita no ano seguinte.