Deteção de Fraude
Áreas Científicas |
Classificação |
Área Científica |
OFICIAL |
Ciência de Computadores |
Ocorrência: 2017/2018 - 2S
Ciclos de Estudo/Cursos
Língua de trabalho
Português - Suitable for English-speaking students
Objetivos
Os objectivos desta unidade curricular passam pelo estudo de meteodologias de análise de dados que sejam úteis em contextos de deteção e/ou previsão de situações fraudulentas. Com a crescente utilização de métodos de recolha de dados em praticamente todas as atividades humanas, aumenta a necessidade da utilização de técnicas que permitam analisar os mesmos de forma automática com o objetivo de detetar e/ou prever situações que possam ser consideradas anómalas e potencialmente fraudulentas.
Resultados de aprendizagem e competências
Pretende que os(as) alunos(as) :
-
Adquiram competências teóricas sobre metodologias de análise de dados úteis para a deteção e previsão de fraude;
-
Adquiram competências práticas para o desenvolvimento e utilização de software para a deteção e previsão de fraude;
-
Adquiram prática de deteção de fraude através da análise de casos de estudo concretos sobre este tipo de problemas.
Modo de trabalho
Presencial
Programa
Semana 1 (15 Feb)
- Apresentação
- Introdução a Data Mining
- Introdução a R
- Conceitos Básicos no R (1/2)
Week 2 (22 Feb)
- Conceitos Básicos no R (2/2)
- 'Reporting' no R
Week 3 (1 Mar)
- Importação de Dados no R
- Pre-Processamento de Dados
- Sumarização de Dados
Week 4 (8 Mar)
- Visualização de Dados
Week 5 (15 Mar)
- Introdução a Modelação Preditiva
- Métricas de Avaliação
- Modelos baseados em árvores
- Naïve Bayes
Week 6 (22 Mar)
- k-Nearest Neighbours
- Support Vector Machines
- Clustering
Week 7 (29 Mar)
Férias da Páscoa
Week 8 (5 Apr)
1º Teste
Week 9 (12 Apr)
- Aprendizagem com Ensembles
Week 10 (19 Apr)
- Metodologias de Avaliação
- Avaliação de Performance
Week 11 (26 Apr)
- Deteção de Outliers
Week 12 (3 May)
- Aprender com Domínios Desbalanceados (1/3)
Week 13 (10 May)
- Aprender com Domínios Desbalanceados (2/3)
Week 14 (17 May)
- Aprender com Domínios Desbalanceados (3/3)
Week 15 (24 May)
2º Teste
Bibliografia Obrigatória
Barnett Vic; Outliers in statistical data. ISBN: 0-471-99599-1
Torgo Luís; Data Mining with R. ISBN: 9781439810187 hbk
Bibliografia Complementar
Han,J.; Kamber,M and Pei,J.; Data Mining: concepts and techniques (3rd edition)
Métodos de ensino e atividades de aprendizagem
As aulas são teórico-práticas, com a exposição da matéria complementada por exercícios práticos em computador.
Software
R statistical software
Tipo de avaliação
Avaliação distribuída sem exame final
Componentes de Avaliação
Designação |
Peso (%) |
Teste |
60,00 |
Trabalho prático ou de projeto |
40,00 |
Total: |
100,00 |
Obtenção de frequência
Para obtenção de frequência é necessário ter mais do que 7 valores em cada um dos dois testes escritos da unidade curricular.
Fórmula de cálculo da classificação final
A classificação final é dada pela fórmula:
NF = 0.6 * NT + 0.4 * NP
em que NT é a nota teórica dada pela média entre a nota dos dois testes escritos; e NP é dado pela média pesada dos dois trabalhos práticos: NP = 0.4*TP1 + 0.6*TP2, em que o TP1 é o primeiro e TP2 é o segundo trabalho prático.
Nota: NT = (NT1 + NT2)/2 em que NT1(2) é a nota no teste 1(2), sujeito a que NT1 > 7 e NT2 > 7.