Saltar para:
Logótipo
Você está em: Início > EIC0054

Extracção de Conhecimento

Código: EIC0054     Sigla: ECON

Áreas Científicas
Classificação Área Científica
OFICIAL Inteligência Artificial

Ocorrência: 2007/2008 - 1S

Ativa? Sim
Página Web: http://paginas.fe.up.pt/~ec/index.html
Unidade Responsável: Secção de Informática
Curso/CE Responsável: Mestrado Integrado em Engenharia Informática e Computação

Ciclos de Estudo/Cursos

Sigla Nº de Estudantes Plano de Estudos Anos Curriculares Créditos UCN Créditos ECTS Horas de Contacto Horas Totais
LEIC 0 Plano de estudos de transição para 2006/07 5 6 6 -
MIEIC 7 Plano de estudos oficial a partir de 2006/07 5 - 6 -
Plano de estudos de transição para 2006/07 5 - 6 -

Língua de trabalho

Português

Objetivos

O objectivo da disciplina é o de dotar os alunos de conhecimentos que os tornem capazes de utilizar técnicas de análise e extracção de padrões de grandes quantidades de dados.

Programa

Introdução à disciplina de extracção de conhecimento: O que se entende por pesquisa de informação (Data Mining).

Metodologia CRISP para desenvolvimento de projectos de extracção de conhecimento

Preparação de Dados: Limpeza de dados; Normalização, Redução e Discretização de dados.

Regras de associação: Definição do problema de pesquisa de regras de associação. Medidas de qualidade das regras de associação Alguns algoritmos de pesquisa de regras de associação.

Clustering: Técnicas de clustering. Algoritmos de clustering de partição (K-means, K-medoids) e Algoritmos de clustering hierárquicos. Outros algoritmos: BIRCH, CURE, DBSCAN.

Web Mining: Conceitos de data mining na Web; Pesquisa de informação na Web; Pesquisa de Padrões de utilização na Web; Pesquisa e análise da estrutura da Web.

Classificação: Técnicas de classificação para análise de grandes quantidades de dados; Árvores de decisão; Árvores de classificação e de Regressão (CART); Princípios de prunning; Classificação Bayesiana. Indução de Programas em Lógica.

Visualização de Dados: Técnicas de visualização para identificação de padrões ou excepções em grandes quantidades de dados.

PKDD: Parallel Knowledge Discovery in Databases - Técnicas de processamento paralelo para extracção de padrões em grandes quantidades de dados.

Aplicações KDD.

Bibliografia Obrigatória

Han, Jiawei; Data mining. ISBN: 1-55860-489-8

Métodos de ensino e atividades de aprendizagem

Aulas teóricas: Exposição dos conceitos referidos.

Tipo de avaliação

Avaliação distribuída com exame final

Obtenção de frequência

Nota média da componente distribuída (trabalho e apresentação de artigo) igual ou superior a 6 valores.

Fórmula de cálculo da classificação final

0.35* Nota do trabalho + 0.15* Apresentação de artigo + 0.5 * Nota do exame

Provas e trabalhos especiais

O trabalho será elaborado em grupo e consiste na análise de um conjunto de dados e preparação de um relatório que apresente o método de análise e os resultados obtidos. Será necessária a apresentação de um relatório de progresso.
O trabalho vale 35% da nota final, sendo 5% relativos ao relatório de progresso e 30% relativos ao relatório final.

Apresentação de artigo consiste na apresentação Oral de um Artigo Cientifico relacionado com a matéria leccionada. O artigo deverá ser seleccionado de um conjunto de artigos propostos pelos docentes. Alternativamente, os alunos poderão propor um artigo para ser apresentado tendo o artigo ser atempadamente aprovado pelos docentes.

Avaliação especial (TE, DA, ...)

Os alunos com estatuto que isenta da frequência das aulas práticas têm que realizar o trabalho prático e a apresentação do artigo.

Melhoria de classificação

A melhoria da avaliação distribuída só pode ser feita no ano seguinte.
Recomendar Página Voltar ao Topo
Copyright 1996-2024 © Faculdade de Engenharia da Universidade do Porto  I Termos e Condições  I Acessibilidade  I Índice A-Z  I Livro de Visitas
Página gerada em: 2024-07-19 às 20:15:46 | Política de Utilização Aceitável | Política de Proteção de Dados Pessoais | Denúncias