Saltar para:
Logótipo
Comuta visibilidade da coluna esquerda
Você está em: Início > Publicações > Visualização > When Two are Better Than One: Synthesizing Heavily Unbalanced Data

Publicações

When Two are Better Than One: Synthesizing Heavily Unbalanced Data

Título
When Two are Better Than One: Synthesizing Heavily Unbalanced Data
Tipo
Artigo em Revista Científica Internacional
Ano
2021
Autores
Ferreira, F
(Autor)
Outra
A pessoa não pertence à instituição. A pessoa não pertence à instituição. A pessoa não pertence à instituição. Sem AUTHENTICUS Sem ORCID
Lourenco, N
(Autor)
Outra
A pessoa não pertence à instituição. A pessoa não pertence à instituição. A pessoa não pertence à instituição. Sem AUTHENTICUS Sem ORCID
Cabral, B
(Autor)
Outra
A pessoa não pertence à instituição. A pessoa não pertence à instituição. A pessoa não pertence à instituição. Sem AUTHENTICUS Sem ORCID
Joao Paulo Fernandes
(Autor)
FEUP
Revista
Título: IEEE AccessImportada do Authenticus Pesquisar Publicações da Revista
Vol. 9
ISSN: 2169-3536
Editora: IEEE
Indexação
Publicação em ISI Web of Knowledge ISI Web of Knowledge - 0 Citações
Publicação em Scopus Scopus - 0 Citações
Outras Informações
ID Authenticus: P-00W-518
Abstract (EN): Nowadays, data is king and if treated and used properly it promises to give organizations a competitive edge over rivals by enabling them to develop and design Intelligent Systems to improve their services. However, they need to fully comply with not only ethical but also regulatory obligations, where, e.g., privacy (strictly) needs to be respected when using or sharing data, thus protecting both the interests of users and organizations. Fraud Detection systems are examples of such systems where Machine Learning algorithms leverage information to classify financial transactions as legitimate or illicit. The data used to create these solutions is usually highly structured and contains categorical and continuous features characterised by complex distributions. One of the main challenges of fraud detection is concerned with the scarcity of fraudulent instances which results in highly unbalanced datasets. Additionally, privacy is crucial, and it is usually forbidden, or not possible, to share the data of organizations and individuals for creating or improving models.In this paper we propose a framework for private data sharing based on synthetic data generation using Generative Adversarial Networks (GAN) that learns the specificities of financial transactions data and generates fictitious data that keeps the utility of the original datasets. Our proposal, called Duo-GAN, uses two GAN generators to handle the data imbalance problem, one generator for fraudulent instances and the other for legitimate instances. With this approach, we observed, at most, a 5% disparity in F1 scores between classifiers trained and tested with actual data and the ones trained with synthetic data and tested with actual data.
Idioma: Inglês
Tipo (Avaliação Docente): Científica
Nº de páginas: 11
Documentos
Não foi encontrado nenhum documento associado à publicação.
Publicações Relacionadas

Da mesma revista

Understanding Business Models for the Adoption of Electric Vehicles and Charging Stations: Challenges and Opportunities in Brazil (2023)
Outra Publicação em Revista Científica Internacional
Bitencourt, L; Dias, B; Soares, T; Borba, B; Quirós Tortós, J; Costa, V
Space Imaging Point Source Detection and Characterization (2024)
Outra Publicação em Revista Científica Internacional
Ribeiro, FSF; P. J. V. Garcia; Silva, M; Jaime S Cardoso
Key Indicators to Assess the Performance of LiDAR-Based Perception Algorithms: A Literature Review (2023)
Outra Publicação em Revista Científica Internacional
José Machado da Silva; K. Chiranjeevi; Correia, M. V.
IEEE ACCESS SPECIAL SECTION EDITORIAL: SOFT COMPUTING TECHNIQUES FOR IMAGE ANALYSIS IN THE MEDICAL INDUSTRY - CURRENT TRENDS, CHALLENGES AND SOLUTIONS (2018)
Outra Publicação em Revista Científica Internacional
D. Jude Hemanth; Lipo Wang; João Manuel R. S. Tavares; Fuqian Shi; Vania Vieira Estrela
Generating Synthetic Missing Data: A Review by Missing Mechanism (2019)
Outra Publicação em Revista Científica Internacional
Santos, MS; Pereira, RC; Costa, AF; Soares, JP; Santos, J; Pedro Henriques Abreu

Ver todas (109)

Recomendar Página Voltar ao Topo
Copyright 1996-2025 © Faculdade de Direito da Universidade do Porto  I Termos e Condições  I Acessibilidade  I Índice A-Z
Página gerada em: 2025-09-03 às 23:57:00 | Política de Privacidade | Política de Proteção de Dados Pessoais | Denúncias