Saltar para:
Logótipo
Você está em: Início > CC4073
Mapa das Instalações
FC6 - Departamento de Ciência de Computadores FC5 - Edifício Central FC4 - Departamento de Biologia FC3 - Departamento de Física e Astronomia e Departamento GAOT FC2 - Departamento de Química e Bioquímica FC1 - Departamento de Matemática

Data Stream Mining

Código: CC4073     Sigla: CC4073     Nível: 400

Áreas Científicas
Classificação Área Científica
OFICIAL Ciência de Computadores

Ocorrência: 2020/2021 - 2S Ícone do Moodle

Ativa? Sim
Unidade Responsável: Departamento de Ciência de Computadores
Curso/CE Responsável: Mestrado em Ciência de Dados (Data Science)

Ciclos de Estudo/Cursos

Sigla Nº de Estudantes Plano de Estudos Anos Curriculares Créditos UCN Créditos ECTS Horas de Contacto Horas Totais
M:DS 17 Plano Oficial a partir de 2018_M:DS 1 - 6 42 162
2

Docência - Responsabilidades

Docente Responsabilidade
João Manuel Portela da Gama Regente

Docência - Horas

Teorico-Prática: 3,00
Tipo Docente Turmas Horas
Teorico-Prática Totais 1 3,00
João Manuel Portela da Gama 3,00
Mais informaçõesA ficha foi alterada no dia 2021-02-12.

Campos alterados: Lingua de trabalho

Língua de trabalho

Inglês

Objetivos

No final do semestre os alunos deverão ser capazes de formular problemas de decisão a partir de fluxos de dados.
Serem capazes de aplicar métodos/algoritmos a um novo problema de análise de fluxos de dados.
Serem capazes de avaliar os resultados e compreender o funcionamento dos métodos estudados.

Resultados de aprendizagem e competências

Conhecimento como formular um problema  de extracção de conhecimento a partir de fluxos de dados.
Capacidade de aplicar métodos/algoritmos a novos problemas de análise de fluxos dados.
Avaliar os resultados e compreender o funcionamento dos métodos estudados.

Modo de trabalho

Presencial

Pré-requisitos (conhecimentos prévios) e co-requisitos (conhecimentos simultâneos)

conhecimentos básicos de extração de conhecimentos

Programa

S1- Fluxos de dados: definições e métodos
Formulação do problema: métodos e técnicas básicos.
Aproximação e randomização.
Problemas ilustrativos e algoritmos

S2 Ferramentaspara processamento de fluxo de dados
MOA, SAMOA

S3- Clustering de fluxos de dados
Métodos básicos de streaming para clustering
Algoritmos de clustering de última geração
Clustering time-series


S4- Alterar detecção
Definição de problema. Métodos básicos para lidar com dados em evolução
Métodos de detecção: Algoritmos CUSUM, SPC, ADWIN

S5- Aprendendo árvores de decisão a partir de fluxos de dados
Árvores de decisão incremental. Árvores de decisão e detecção de alterações


S6- Modelos de conjuntos
Bagagem e Impulsos Online. Algoritmos de ponderação ponderada dinâmica

S7- Avaliação de algoritmos de aprendizado de fluxo
Métricas de avaliação. Abordagens sequenciais preditivas.


S8 Aplicações 
Sistemas de recomendação, fluxos de cliques, mídias sociais


S9- Detecção de novidade.
Classificação de uma classe, detecção de novidade e reconhecimento de conjunto aberto
Métodos baseados em cluster para detecção de novidades.


S10- mineração de dados ubíqua
Clustering distribuído: duas visualizações.
Dados de cluster distribuídos
Fontes de dados de cluster distribuído


Redes de Evolução S11.
Acompanhamento de comunidades em desenvolvimento em redes sociais de larga escala

S12 Padrões frequentes
Definição de problema.
Algoritmos aproximados para contar a frequência dos itens.
Algoritmos aproximados para contar a frequência dos conjuntos de itens.

Bibliografia Obrigatória

Gama João; Knowledge discovery from data streams. ISBN: 978-1-4398-2611-9
Albert Bifet, Ricard Gavalda; Machine Learning for Data Streams, MIT Press, 2017

Métodos de ensino e atividades de aprendizagem

Aulas teórico-praticas

Software

Massive Online Analysis

Palavras Chave

Ciências Físicas > Ciência de computadores > Cibernética > Inteligência artificial

Tipo de avaliação

Avaliação distribuída sem exame final

Componentes de Avaliação

Designação Peso (%)
Apresentação/discussão de um trabalho científico 40,00
Participação presencial 20,00
Trabalho escrito 40,00
Total: 100,00

Componentes de Ocupação

Designação Tempo (Horas)
Apresentação/discussão de um trabalho científico 0,00
Frequência das aulas 0,00
Trabalho de investigação 0,00
Total: 0,00

Obtenção de frequência

Positiva em dois trabalhos

Fórmula de cálculo da classificação final

Hw1 - nota 1º trabalho
Hw2 - nota 2º trabalho

Hw1 > 9.5 e HW2 > 9.5
Recomendar Página Voltar ao Topo
Copyright 1996-2022 © Faculdade de Ciências da Universidade do Porto  I Termos e Condições  I Acessibilidade  I Índice A-Z  I Livro de Visitas
Página gerada em: 2022-10-01 às 02:08:45 | Política de Utilização Aceitável | Política de Proteção de Dados Pessoais | Denúncias