Saltar para:
Logótipo
This page in english Ajuda Autenticar-se
Projecto da Casa da U. Porto
Você está em: Início > PRODEI043
Autenticação




Mapa das Instalações
Edifício A (Administração) Edifício B (Aulas) - Bloco I Edifício B (Aulas) - Bloco II Edifício B (Aulas) - Bloco III Edifício B (Aulas) - Bloco IV Edifício C (Biblioteca) Edifício D (CICA) Edifício E (Química) Edifício F (Minas e Metalurgia) Edifício F (Minas e Metalurgia) Edifício G (Civil) Edifício H (Civil) Edifício I (Electrotecnia) Edifício J (Electrotecnia) Edifício K (Pavilhão FCNAUP) Edifício L (Mecânica) Edifício M (Mecânica) Edifício N (Garagem) Edifício O (Cafetaria) Edifício P (Cantina) Edifício Q (Central de Gases) Edifício R (Laboratório de Engenharia do Ambiente) Edifício S (INESC) Edifício T (Torre do INEGI) Edifício U (Nave do INEGI) Edifício X (Associação de Estudantes)

Tópicos Avançados de Extração de Conhecimento e Aprendizagem Computacional

Código: PRODEI043     Sigla: TAECAC

Áreas Científicas
Classificação Área Científica
OFICIAL Sistemas Inteligentes

Ocorrência: 2018/2019 - 1S Ícone do Moodle

Ativa? Sim
Unidade Responsável: Departamento de Engenharia Informática
Curso/CE Responsável: Programa Doutoral em Engenharia Informática

Ciclos de Estudo/Cursos

Sigla Nº de Estudantes Plano de Estudos Anos Curriculares Créditos UCN Créditos ECTS Horas de Contacto Horas Totais
PRODEI 6 Plano de estudos Oficial 1 - 6 28 162

Docência - Horas

Teórico-Práticas: 2,00
Tipo Docente Turmas Horas
Teórico-Práticas Totais 1 2,00
José Luís Cabral Moura Borges 0,75
Rui Carlos Camacho de Sousa Ferreira da Silva 1,25

Língua de trabalho

Português - Suitable for English-speaking students

Objetivos

Enquadramento

 

Empresas e Instituições de Investigação Científica recolhem, hoje em dia, enormes quantidades de dados.
A análise desses dados pode ser uma mais-valia tanto em termos de vantagem competitiva (no caso das empresas) como fonte de novas descobertas (no caso da Investigação Científica).
Para grandes quantidades de dados ou para análises complexas baseadas em dados, os processos manuais ou mesmo técnicas de OLAP são proibitivas. Ferramentas informáticas, usando algoritmos de análise de dados (Estatística, Machine Learning, Data Mining, etc.), são necessárias para a construção [semi-]automática de modelos que auxiliem os decisores e investigadores a resolver problemas complexos com base nesses dados.
 

Objetivos

  • Motivar para a utilização de técnicas de Extração de Conhecimento (EC) de dados, ou Data Mining, no apoio à decisão.
  • Desenvolver a capacidade de utilizar corretamente essas técnicas para análise automática de grandes quantidades de dados.
  • Familiarização com técnicas e tópicos avançados de EC.

Resultados de aprendizagem e competências

Pretende-se que os estudantes:


  • Conheçam os vários tipos de tarefas de EC.

  • Identifiquem problemas de apoio à decisão que possam ser representados como tarefas de EC.

  • Conheçam as fases de um projeto de EC.

  • Conheçam os principais métodos/algoritmos para cada tipo de tarefa de EC e compreendam o essencial do seu funcionamento. Será dada particular ênfase a algoritmos relacionais.

  • Apliquem esses métodos a problemas de apoio à decisão.

  • Avaliem os resultados de um projeto de EC.


Modo de trabalho

Presencial

Pré-requisitos (conhecimentos prévios) e co-requisitos (conhecimentos simultâneos)

Não sendo obrigatório ter frequentado nenhuma UC em concreto, é útil o estudante ter frequentado alguma UC de introdução à estatística e a UC de Extração de Conhecimento e Aprendizagem Computacional. É também relevante que o estudante tenha conhecimentos elementares de algoritmia.

Programa


  • Introdução ao Data Mining

  • Data Mining descritivo

  • Data Mining preditivo

  • Avaliação de modelos preditivos

  • Meta-learning

  • Visualização

  • Recommender Systems

  • Text Mining

  • Introdução do Data Mining multi-relacional

  • Inductive Logic Programming

  • Clustering relational

  • Graph Mining

  • Statistical Relational Learning

Bibliografia Obrigatória

Jiawei Han, Micheline Kamber; Data mining. ISBN: 1-55860-489-8
Lavrac N., and Dzeroski S.; Inductive Logic Programming: Techniques and Applications, 1994. ISBN: 0134578708

Bibliografia Complementar

Ian H. Witten, Eibe Frank; Data mining. ISBN: 1-55860-552-5
Peter Flach; Machine Learning: The Art and Science of Algorithms that Make Sense of Data, Cambridge University Press, 2012. ISBN: 9781107422223 (http://www.cs.bris.ac.uk/~flach/mlbook/)
Mohammed Zaki and Wagner Meira Jr.; Data Mining and Analysis: Fundamental Concepts and Algorithms, Cambridge University Press, 2013. ISBN: 9780521766333 (http://www.dcc.ufmg.br/miningalgorithms/DokuWiki/doku.php)
Max Kuhn, Kjell Johnson; Applied Predictive Modeling, Springer New York, 2013. ISBN: 9781461468493
Jure Leskovec, Anand Rajaraman, Jeff Ullman; Mining of Massive Datasets, 2014. ISBN: 978-1107077232

Métodos de ensino e atividades de aprendizagem

Aulas teóricas para exposição dos conceitos referidos.

Sessões laboratoriais para aplicação prática dos conceitos aprendidos.

Software

Aleph ILP system
The R Project for Statistical Computing
RapidMiner 5
weka

Tipo de avaliação

Avaliação distribuída sem exame final

Componentes de Avaliação

Designação Peso (%)
Trabalho laboratorial 100,00
Total: 100,00

Componentes de Ocupação

Designação Tempo (Horas)
Estudo autónomo 60,00
Frequência das aulas 42,00
Trabalho laboratorial 60,00
Total: 162,00

Obtenção de frequência

A avaliação distribuída consiste na elaboração de um trabalho prático. Os trabalhadores estudantes e equivalentes dispensados das aulas devem, com periodicidade a combinar com os docentes, apresentar a evolução dos seus trabalhos, assim como devem fazer a apresentação destes, simultaneamente com os alunos ordinários.

Fórmula de cálculo da classificação final

Nota = 0.4 * qualidade do trabalho + 0.4 * relatório sob a forma de artigo científico + 0.2 apresentação e discussão

Provas e trabalhos especiais

O trabalho será elaborado individualmente e consiste na análise de um conjunto de dados, escrita de um relatório descrevendo o trabalho realizado e preparação de uma apresentação para a discussão oral do trabalho realizado.

Avaliação especial (TE, DA, ...)

Todos os alunos (mesmo os que têm isenção de frequência das aulas) têm que realizar o trabalho prático.

Melhoria de classificação

A melhoria da avaliação distribuída só pode ser feita no ano seguinte.

Recomendar Página Voltar ao Topo
Copyright 1996-2019 © Faculdade de Engenharia da Universidade do Porto  I Termos e Condições  I Acessibilidade  I Índice A-Z  I Livro de Visitas
Página gerada em: 2019-04-25 às 03:35:45 | Política de Utilização Aceitável | Política de Proteção de Dados Pessoais