Saltar para:
Logótipo
Você está em: Início > EIC0096

Extracção de Conhecimento e Aprendizagem Computacional

Código: EIC0096     Sigla: ECAC

Áreas Científicas
Classificação Área Científica
OFICIAL Inteligência Artificial

Ocorrência: 2017/2018 - 1S Ícone do Moodle

Ativa? Sim
Unidade Responsável: Departamento de Engenharia Informática
Curso/CE Responsável: Mestrado Integrado em Engenharia Informática e Computação

Ciclos de Estudo/Cursos

Sigla Nº de Estudantes Plano de Estudos Anos Curriculares Créditos UCN Créditos ECTS Horas de Contacto Horas Totais
MIEIC 56 Plano de estudos a partir de 2009/10 5 - 6 42 162

Língua de trabalho

Português - Suitable for English-speaking students

Objetivos

Enquadramento


Após uma época em que as diferentes empresas/instituições muito investiram na recolha de dados no âmbito da informatização das suas operações, surge agora a necessidade de pôr esses dados ao serviço dessas empresas/instituições. O objetivo é ser capaz de extrair conhecimento desses dados que permita melhorar a eficiência e ganhar vantagem competitiva. É desta necessidade que surge a Unidade Curricular (UC) de Extração de Conhecimento e Aprendizagem Computacional (ECAC).


Objetivos



  • Motivar para a utilização de técnicas de extração de conhecimento (EC) de dados, ou data mining, no apoio à decisão.

  • Desenvolver a capacidade de utilizar corretamente essas técnicas para análise automática de grandes quantidades de dados. 


Distribuição percentual



  • Componente científica: 70%

  • Componente tecnológica: 30%

Resultados de aprendizagem e competências

Pretende-se que os estudantes:

  • Conheçam os vários tipos de tarefas de EC.
  • Identifiquem problemas de apoio à decisão que possam ser representados como tarefas de EC.
  • Conheçam as fases de um projecto de EC.
  • Conheçam os principais métodos/algoritmos para cada tipo de tarefa de EC e compreendam o essencial do seu funcionamento.
  • Apliquem esses métodos a problemas de apoio à decisão.
  • Avaliem os resultados de um projeto de EC.

Modo de trabalho

Presencial

Pré-requisitos (conhecimentos prévios) e co-requisitos (conhecimentos simultâneos)


  • Não sendo obrigatório ter frequentado nenhuma UC em concreto, é útil o estudante ter frequentado alguma UC de introdução à estatística.

  • É também relevante que o estudante tenha conhecimentos elementares de algoritmia.

Programa

Data Mining descritivo



  • Introdução à extracção de conhecimento (Data Mining).

  • Clustering: Algoritmos de partição (revisão do K-means, K-medoids) e algoritmos hierárquicos. Outros algoritmos. Medidas de avaliação.

  • Regras de associação: Algoritmo APRIORI. Outros algoritmos. Medidas de avaliação.

  • Metodologias de Data Mining: Processo de extração de conhecimento. Metodologia CRISP-DM. Gestão de projetos.

  • Pré-processamento de dados: Limpeza de dados e transformação de dados (normalização, redução e discretização).


Data Mining preditivo



  • Avaliação de modelos preditivos: Revisão sobre árvores de decisão. Sobre-ajustamento em árvores de decisão. Metodologias de avaliação.

  • Classificação: Algoritmos de classificação (métodos baseados em regras, distâncias e kernels; métodos Bayesianos). Questões comuns em classificação (distribuição de classes desequilibrada e custos). Medidas de avaliação.

  • Regressão: Algoritmos de regressão (regressão linear e não linear, árvores de regressão, MARS). Medidas de avaliação.


Análise de Dados complexos



  • Text mining: Representação de dados para text mining. Medidas de avaliação. - Web Mining e sistemas de recomendação.

Bibliografia Obrigatória

Jiawei Han, Micheline Kamber; Data mining. ISBN: 1-55860-489-8

Bibliografia Complementar

Ian H. Witten, Eibe Frank; Data mining. ISBN: 1-55860-552-5
Peter Flach; Machine Learning: The Art and Science of Algorithms that Make Sense of Data, Cambridge University Press, 2012. ISBN: 9781107422223 (http://www.cs.bris.ac.uk/~flach/mlbook/)
Mohammed Zaki and Wagner Meira Jr.; Data Mining and Analysis: Fundamental Concepts and Algorithms, Cambridge University Press, 2013. ISBN: 9780521766333 (http://www.dcc.ufmg.br/miningalgorithms/DokuWiki/doku.php)
Max Kuhn, Kjell Johnson; Applied Predictive Modeling, Springer New York, 2013. ISBN: 9781461468493

Métodos de ensino e atividades de aprendizagem


  • Aulas teóricas para Exposição dos conceitos referidos.

  • Sessões laboratoriais para aplicação prática dos conceitos aprendidos.

Software

RapidMiner 5
The R Project for Statistical Computing

Tipo de avaliação

Avaliação distribuída com exame final

Componentes de Avaliação

Designação Peso (%)
Exame 50,00
Participação presencial 0,00
Trabalho laboratorial 50,00
Total: 100,00

Componentes de Ocupação

Designação Tempo (Horas)
Estudo autónomo 60,00
Frequência das aulas 42,00
Trabalho laboratorial 60,00
Total: 162,00

Obtenção de frequência

A avaliação distribuída consiste na elaboração de um trabalho prático. No caso de falta a um dos momentos da avaliação distribuída, a nota atribuida é de 0 (zero) valores. Os trabalhadores estudantes e equivalentes dispensados das aulas devem, com periodicidade a combinar com os docentes, apresentar a evolução dos seus trabalhos, assim como devem fazer a apresentação destes, simultaneamente com os alunos ordinários

Fórmula de cálculo da classificação final

0.50* Nota do trabalho + 0.5 * Nota do exame

Provas e trabalhos especiais

O exame será realizado sem acesso a consulta.

O trabalho será elaborado em grupos de 2 estudantes e consiste na análise de um conjunto de dados e preparação de um apresentação que descreva e discuta tanto o projeto como os resultados obtidos.

 

Avaliação especial (TE, DA, ...)

Os alunos com estatuto que isenta da frequência das aulas têm que realizar o trabalho prático e ser sujeitos a exame.

Melhoria de classificação

A melhoria da avaliação distribuída só pode ser feita no ano seguinte.

Recomendar Página Voltar ao Topo
Copyright 1996-2024 © Faculdade de Engenharia da Universidade do Porto  I Termos e Condições  I Acessibilidade  I Índice A-Z  I Livro de Visitas
Página gerada em: 2024-07-27 às 19:28:58 | Política de Utilização Aceitável | Política de Proteção de Dados Pessoais | Denúncias