Saltar para:
Logótipo
Você está em: Início > EIC0096

Extracção de Conhecimento e Aprendizagem Computacional

Código: EIC0096     Sigla: ECAC

Áreas Científicas
Classificação Área Científica
OFICIAL Inteligência Artificial

Ocorrência: 2020/2021 - 1S Ícone do Moodle

Ativa? Sim
Unidade Responsável: Departamento de Engenharia Informática
Curso/CE Responsável: Mestrado Integrado em Engenharia Informática e Computação

Ciclos de Estudo/Cursos

Sigla Nº de Estudantes Plano de Estudos Anos Curriculares Créditos UCN Créditos ECTS Horas de Contacto Horas Totais
MIEIC 65 Plano de estudos a partir de 2009/10 5 - 6 42 162
Mais informaçõesA ficha foi alterada no dia 2020-09-21.

Campos alterados: Métodos de ensino e atividades de aprendizagem, Melhoria de classificação, Fórmula de cálculo da classificação final

Língua de trabalho

Português - Suitable for English-speaking students

Objetivos

Com a digitalização crescente dos seus processos, as organizações (empresas, governo, etc.) sentem agora a necessidade de extrair conhecimento desses dados, que permita melhorar a eficiência e eficácia desses processos (por ex. para ganhar vantagem competitiva). Para esse fim, as organizações precisam de adquirir competências técnicas, para o desenvolvimento de soluções baseadas em abordagens standard de Aprendizagem Computacional (AC ou machine learning) e Extração de Conhecimento de Dados (ECD ou data mining), mas também de competências científicas para o desenvolvimento de soluções inovadoras para os problemas em que essas abordagens standard não existem. 

Assim, os objetivos desta U.C. são:

  • Motivar para a utilização de técnicas de AC/ECD no apoio à decisão.
  • Desenvolver a capacidade de utilizar corretamente essas técnicas para análise automática de grandes quantidades de dados.
  • Desenvolver a capacidade de realizar investigação científica para desenvolver novas abordagens de AC/ECD.

Distribuição percentual

  • Componente científica: 70%
  • Componente tecnológica: 30%

Resultados de aprendizagem e competências

Pretende-se que os estudantes:

  • Conheçam os vários tipos de tarefas de ECD.
  • Identifiquem problemas de apoio à decisão que possam ser representados como tarefas de ECD.
  • Conheçam os principais métodos/algoritmos para as tarefas mais comuns de ECD e compreendam o essencial do seu funcionamento.
  • Apliquem corretamente esses métodos na realização de um projeto de ECD, seguindo uma metodologia adequada.
  • Avaliem de forma adequada os resultados de um projeto de ECD.
  • Identifiquem oportunidades de desenvolvimento de novas abordagens de AC/ECD.
  • Desenvolvam trabalho científico simples, mas adequado para criação de novas abordagens de AC/ECD.

Modo de trabalho

Presencial

Pré-requisitos (conhecimentos prévios) e co-requisitos (conhecimentos simultâneos)

Não sendo obrigatório ter frequentado nenhuma UC em concreto, é útil o estudante ter conhecimentos básicos de


  • estatística

  • algoritmia

  • inteligência artificial e aprendizagem computacional.

Programa


  • Introdução à Aprendizagem Computacional (Machine Learning) e à Extração de Conhecimento de Dados (Data Mining).

  • Projetos de ECD: metodologias de ECD e preparação de dados.

  • Classificação: introdução, avaliação (medidas e metodologias) e algoritmos (métodos baseados em regras, distâncias e kernels; métodos Bayesianos). Scoring com modelos de classificação: abordagem e avaliação. Questões comuns em classificaçăo (distribuiçăo de classes desequilibrada e custos).

  • Regressão: introdução, avaliação (medidas; compromisso entre viés e variância) e algoritmos.

  • Clustering: Algoritmos de partição (revisăo dos algoritmos K-means, K-medoids), de densidade e hierárquicos. Medidas de avaliação.

  • Descoberta de padrões frequentes: Algoritmos de conjuntos de itens frequentes (APRIORI, Eclat, FP-Growth) e de regras de associação. Medidas de avaliação (Suporte, confiança, lift, ...). Outros tipos de padrões: sequências e grafos.

  • Sistemas de recomendação: introdução, avaliação (medidas e metodologias) e algoritmos (baseados em conteúdos, filtragem colaborativa, sistemas especializados).

  • Ensemble learning: métodos (Bagging, Florestas Aleatórias, AdaBoost, Aprendizagem de correlação negativa). Características de um bom ensemble. 

  • Aprendizagem incremental: introdução, avaliação (medidas e metodologias) e algoritmos (árvores de decisão muito rápidas, algoritmos de clustering incrementais).

  • Aprendizagem computacional automática (autoML) e meta aprendizagem. 


 

Bibliografia Obrigatória

João Moreira, Andre Carvalho, Tomás Horvath; Data Analytics: A General Introduction, Wiley, 2018. ISBN: 978-1-119-29626-3 (https://www.wiley.com/en-aw/A+General+Introduction+to+Data+Analytics-p-9781119296263)

Bibliografia Complementar

Ian H. Witten, Eibe Frank; Data mining. ISBN: 1-55860-552-5
Peter Flach; Machine Learning: The Art and Science of Algorithms that Make Sense of Data, Cambridge University Press, 2012. ISBN: 9781107422223 (http://www.cs.bris.ac.uk/~flach/mlbook/)
Mohammed Zaki and Wagner Meira Jr.; Data Mining and Analysis: Fundamental Concepts and Algorithms, Cambridge University Press, 2013. ISBN: 9780521766333 (http://www.dcc.ufmg.br/miningalgorithms/DokuWiki/doku.php)
Jiawei Han, Micheline Kamber; Data mining. ISBN: 1-55860-489-8
Max Kuhn, Kjell Johnson; Applied Predictive Modeling, Springer New York, 2013. ISBN: 9781461468493
Charu C. Aggarwal; Data mining. ISBN: 978-3-319-14142-8

Métodos de ensino e atividades de aprendizagem


  • Aulas teóricas e estudo individual para aquisição dos conceitos.

  • Sessões laboratoriais e projeto de ECD para aplicação prática e consolidação dos conceitos aprendidos.

  • Projeto de investigação e escrita de artigo científico para desenvolvimento de competências de investigação.

Software

Python
Rapid Miner
The R Project for Statistical Computing

Tipo de avaliação

Avaliação distribuída sem exame final

Componentes de Avaliação

Designação Peso (%)
Exame 35,00
Participação presencial 0,00
Trabalho laboratorial 65,00
Total: 100,00

Componentes de Ocupação

Designação Tempo (Horas)
Estudo autónomo 60,00
Frequência das aulas 42,00
Trabalho laboratorial 60,00
Total: 162,00

Obtenção de frequência

A avaliação distribuída consiste em:


  • projeto de ECD,

  • mini-teste, e

  • projeto científico, incluindo a escrita de um artigo científico.


No caso de falta a um dos momentos da avaliação distribuída, a nota respetiva é de 0 (zero) valores.
 
Os trabalhadores estudantes e equivalentes dispensados das aulas devem, com periodicidade a combinar com os docentes, apresentar a evolução dos seus trabalhos, assim como devem fazer as apresentação calendarizadas simultaneamente com os alunos ordinários.

Fórmula de cálculo da classificação final

0,3 * projeto de ECD + 0,35 * mini-teste + 0,35 * projeto científico
 
Nota mínima em cada componente: 7,0 (sete) valores (em 20).

Provas e trabalhos especiais

O projeto de ECD será elaborado em grupos de 2 estudantes e consiste na análise de um conjunto de dados e preparação de um apresentação que descreva e discuta tanto o projeto como os resultados obtidos.
 
O projeto científico será elaborado individualmente ou em grupos com até 3 estudantes.

Avaliação especial (TE, DA, ...)

Os alunos com estatuto que isenta da frequência das aulas têm que realizar todas as componentes de avaliação, devendo contactar o regente para definir eventuais ajustes.

Melhoria de classificação

Pode ser feita melhoria de classificação no mini-teste e no projeto científico na época de recurso do ano em que o estudante é aprovado.

Para os momentos em que não foi feita melhoria de classificação no ano em que o estudante é aprovado, pode ser feita melhoria em um ou mais dos momentos de avaliação no ano seguinte, na época normal ou de recurso.
Recomendar Página Voltar ao Topo
Copyright 1996-2024 © Faculdade de Engenharia da Universidade do Porto  I Termos e Condições  I Acessibilidade  I Índice A-Z  I Livro de Visitas
Página gerada em: 2024-10-06 às 15:28:56 | Política de Utilização Aceitável | Política de Proteção de Dados Pessoais | Denúncias