Extracção de Conhecimento e Aprendizagem Computacional
Áreas Científicas |
Classificação |
Área Científica |
OFICIAL |
Inteligência Artificial |
Ocorrência: 2020/2021 - 1S
Ciclos de Estudo/Cursos
Língua de trabalho
Português - Suitable for English-speaking students
Objetivos
Com a digitalização crescente dos seus processos, as organizações (empresas, governo, etc.) sentem agora a necessidade de extrair conhecimento desses dados, que permita melhorar a eficiência e eficácia desses processos (por ex. para ganhar vantagem competitiva). Para esse fim, as organizações precisam de adquirir competências técnicas, para o desenvolvimento de soluções baseadas em abordagens standard de Aprendizagem Computacional (AC ou machine learning) e Extração de Conhecimento de Dados (ECD ou data mining), mas também de competências científicas para o desenvolvimento de soluções inovadoras para os problemas em que essas abordagens standard não existem.
Assim, os objetivos desta U.C. são:
- Motivar para a utilização de técnicas de AC/ECD no apoio à decisão.
- Desenvolver a capacidade de utilizar corretamente essas técnicas para análise automática de grandes quantidades de dados.
- Desenvolver a capacidade de realizar investigação científica para desenvolver novas abordagens de AC/ECD.
Distribuição percentual
- Componente científica: 70%
- Componente tecnológica: 30%
Resultados de aprendizagem e competências
Pretende-se que os estudantes:
- Conheçam os vários tipos de tarefas de ECD.
- Identifiquem problemas de apoio à decisão que possam ser representados como tarefas de ECD.
- Conheçam os principais métodos/algoritmos para as tarefas mais comuns de ECD e compreendam o essencial do seu funcionamento.
- Apliquem corretamente esses métodos na realização de um projeto de ECD, seguindo uma metodologia adequada.
- Avaliem de forma adequada os resultados de um projeto de ECD.
- Identifiquem oportunidades de desenvolvimento de novas abordagens de AC/ECD.
- Desenvolvam trabalho científico simples, mas adequado para criação de novas abordagens de AC/ECD.
Modo de trabalho
Presencial
Pré-requisitos (conhecimentos prévios) e co-requisitos (conhecimentos simultâneos)
Não sendo obrigatório ter frequentado nenhuma UC em concreto, é útil o estudante ter conhecimentos básicos de
- estatística
- algoritmia
- inteligência artificial e aprendizagem computacional.
Programa
- Introdução à Aprendizagem Computacional (Machine Learning) e à Extração de Conhecimento de Dados (Data Mining).
- Projetos de ECD: metodologias de ECD e preparação de dados.
- Classificação: introdução, avaliação (medidas e metodologias) e algoritmos (métodos baseados em regras, distâncias e kernels; métodos Bayesianos). Scoring com modelos de classificação: abordagem e avaliação. Questões comuns em classificaçăo (distribuiçăo de classes desequilibrada e custos).
- Regressão: introdução, avaliação (medidas; compromisso entre viés e variância) e algoritmos.
- Clustering: Algoritmos de partição (revisăo dos algoritmos K-means, K-medoids), de densidade e hierárquicos. Medidas de avaliação.
- Descoberta de padrões frequentes: Algoritmos de conjuntos de itens frequentes (APRIORI, Eclat, FP-Growth) e de regras de associação. Medidas de avaliação (Suporte, confiança, lift, ...). Outros tipos de padrões: sequências e grafos.
- Sistemas de recomendação: introdução, avaliação (medidas e metodologias) e algoritmos (baseados em conteúdos, filtragem colaborativa, sistemas especializados).
- Ensemble learning: métodos (Bagging, Florestas Aleatórias, AdaBoost, Aprendizagem de correlação negativa). Características de um bom ensemble.
- Aprendizagem incremental: introdução, avaliação (medidas e metodologias) e algoritmos (árvores de decisão muito rápidas, algoritmos de clustering incrementais).
- Aprendizagem computacional automática (autoML) e meta aprendizagem.
Bibliografia Obrigatória
João Moreira, Andre Carvalho, Tomás Horvath;
Data Analytics: A General Introduction, Wiley, 2018. ISBN: 978-1-119-29626-3 (https://www.wiley.com/en-aw/A+General+Introduction+to+Data+Analytics-p-9781119296263)
Bibliografia Complementar
Ian H. Witten, Eibe Frank;
Data mining. ISBN: 1-55860-552-5
Peter Flach;
Machine Learning: The Art and Science of Algorithms that Make Sense of Data, Cambridge University Press, 2012. ISBN: 9781107422223 (http://www.cs.bris.ac.uk/~flach/mlbook/)
Mohammed Zaki and Wagner Meira Jr.;
Data Mining and Analysis: Fundamental Concepts and Algorithms, Cambridge University Press, 2013. ISBN: 9780521766333 (http://www.dcc.ufmg.br/miningalgorithms/DokuWiki/doku.php)
Jiawei Han, Micheline Kamber;
Data mining. ISBN: 1-55860-489-8
Max Kuhn, Kjell Johnson;
Applied Predictive Modeling, Springer New York, 2013. ISBN: 9781461468493
Charu C. Aggarwal;
Data mining. ISBN: 978-3-319-14142-8
Métodos de ensino e atividades de aprendizagem
- Aulas teóricas e estudo individual para aquisição dos conceitos.
- Sessões laboratoriais e projeto de ECD para aplicação prática e consolidação dos conceitos aprendidos.
- Projeto de investigação e escrita de artigo científico para desenvolvimento de competências de investigação.
Software
Python
Rapid Miner
The R Project for Statistical Computing
Tipo de avaliação
Avaliação distribuída sem exame final
Componentes de Avaliação
Designação |
Peso (%) |
Exame |
35,00 |
Participação presencial |
0,00 |
Trabalho laboratorial |
65,00 |
Total: |
100,00 |
Componentes de Ocupação
Designação |
Tempo (Horas) |
Estudo autónomo |
60,00 |
Frequência das aulas |
42,00 |
Trabalho laboratorial |
60,00 |
Total: |
162,00 |
Obtenção de frequência
A avaliação distribuída consiste em:
- projeto de ECD,
- mini-teste, e
- projeto científico, incluindo a escrita de um artigo científico.
No caso de falta a um dos momentos da avaliação distribuída, a nota respetiva é de 0 (zero) valores.
Os trabalhadores estudantes e equivalentes dispensados das aulas devem, com periodicidade a combinar com os docentes, apresentar a evolução dos seus trabalhos, assim como devem fazer as apresentação calendarizadas simultaneamente com os alunos ordinários.
Fórmula de cálculo da classificação final
0,3 * projeto de ECD + 0,35 * mini-teste + 0,35 * projeto científico
Nota mínima em cada componente: 7,0 (sete) valores (em 20).
Provas e trabalhos especiais
O projeto de ECD será elaborado em grupos de 2 estudantes e consiste na análise de um conjunto de dados e preparação de um apresentação que descreva e discuta tanto o projeto como os resultados obtidos.
O projeto científico será elaborado individualmente ou em grupos com até 3 estudantes.
Avaliação especial (TE, DA, ...)
Os alunos com estatuto que isenta da frequência das aulas têm que realizar todas as componentes de avaliação, devendo contactar o regente para definir eventuais ajustes.
Melhoria de classificação
Pode ser feita melhoria de classificação no mini-teste e no projeto científico na época de recurso do ano em que o estudante é aprovado.
Para os momentos em que não foi feita melhoria de classificação no ano em que o estudante é aprovado, pode ser feita melhoria em um ou mais dos momentos de avaliação no ano seguinte, na época normal ou de recurso.