Saltar para:
Logótipo
Comuta visibilidade da coluna esquerda
Você está em: Início > Publicações > Visualização > A Dataset of Photos and Videos for Digital Forensics Analysis Using Machine Learning Processing

Publicações

A Dataset of Photos and Videos for Digital Forensics Analysis Using Machine Learning Processing

Título
A Dataset of Photos and Videos for Digital Forensics Analysis Using Machine Learning Processing
Tipo
Artigo em Revista Científica Internacional
Ano
2021
Autores
Ferreira, S
(Autor)
Outra
A pessoa não pertence à instituição. A pessoa não pertence à instituição. A pessoa não pertence à instituição. Sem AUTHENTICUS Sem ORCID
Antunes, M
(Autor)
Outra
A pessoa não pertence à instituição. A pessoa não pertence à instituição. A pessoa não pertence à instituição. Ver página do Authenticus Sem ORCID
Revista
A Revista está pendente de validação pelos Serviços Administrativos.
Título: DATAImportada do Authenticus Pesquisar Publicações da Revista
Página Final: 87
Classificação Científica
CORDIS: Ciências Tecnológicas > Engenharia > Engenharia de computadores
FOS: Ciências exactas e naturais > Ciências da computação e da informação
Outras Informações
ID Authenticus: P-00V-7V8
Abstract (EN): Deepfake and manipulated digital photos and videos are being increasingly used in a myriad of cybercrimes. Ransomware, the dissemination of fake news, and digital kidnapping-related crimes are the most recurrent, in which tampered multimedia content has been the primordial disseminating vehicle. Digital forensic analysis tools are being widely used by criminal investigations to automate the identification of digital evidence in seized electronic equipment. The number of files to be processed and the complexity of the crimes under analysis have highlighted the need to employ efficient digital forensics techniques grounded on state-of-the-art technologies. Machine Learning (ML) researchers have been challenged to apply techniques and methods to improve the automatic detection of manipulated multimedia content. However, the implementation of such methods have not yet been massively incorporated into digital forensic tools, mostly due to the lack of realistic and well-structured datasets of photos and videos. The diversity and richness of the datasets are crucial to benchmark the ML models and to evaluate their appropriateness to be applied in real-world digital forensics applications. An example is the development of third-party modules for the widely used Autopsy digital forensic application. This paper presents a dataset obtained by extracting a set of simple features from genuine and manipulated photos and videos, which are part of state-of-the-art existing datasets. The resulting dataset is balanced, and each entry comprises a label and a vector of numeric values corresponding to the features extracted through a Discrete Fourier Transform (DFT). The dataset is available in a GitHub repository, and the total amount of photos and video frames is 40,588 and 12,400, respectively. The dataset was validated and benchmarked with deep learning Convolutional Neural Networks (CNN) and Support Vector Machines (SVM) methods; however, a plethora of other existing ones can be applied. Generically, the results show a better F1-score for CNN when comparing with SVM, both for photos and videos processing. CNN achieved an F1-score of 0.9968 and 0.8415 for photos and videos, respectively. Regarding SVM, the results obtained with 5-fold cross-validation are 0.9953 and 0.7955, respectively, for photos and videos processing. A set of methods written in Python is available for the researchers, namely to preprocess and extract the features from the original photos and videos files and to build the training and testing sets. Additional methods are also available to convert the original PKL files into CSV and TXT, which gives more flexibility for the ML researchers to use the dataset on existing ML frameworks and tools.
Idioma: Inglês
Tipo (Avaliação Docente): Científica
Nº de páginas: 15
Documentos
Não foi encontrado nenhum documento associado à publicação.
Publicações Relacionadas

Dos mesmos autores

Exposing Manipulated Photos and Videos in Digital Forensics Analysis (2021)
Artigo em Revista Científica Internacional
Ferreira, S; Antunes, M; Manuel E Correia
Forensic Analysis of Tampered Digital Photos (2021)
Artigo em Livro de Atas de Conferência Internacional
Ferreira, S; Antunes, M; Manuel E Correia

Das mesmas áreas científicas

Apontamentos de Pascal LEM (2000)
Publicação Didática
Luísa Costa Sousa
Method and device for live-streaming with opportunistic mobile edge cloud offloading (2022)
Patente
Manuel E Correia; Rolando S Martins; Luis F Antunes; Fernando M Silva
Deterministic Motif Mining in Protein Databases (2009)
Capítulo ou Parte de Livro
Ferreira, PG; Azevedo, PJ

Ver todas (55)

Da mesma revista

A Systematic Survey of ML Datasets for Prime CV Research Areas-Media and Metadata (2021)
Outra Publicação em Revista Científica Internacional
Maria Teresa Andrade; Hélder F. Castro ; Jaime S. Cardoso
Tools for Remote Exploration: A Lithium (Li) Dedicated Spectral Library of the Fregeneda-Almendra Aplite-Pegmatite Field (2021)
Artigo em Revista Científica Internacional
Cardoso Fernandes, J; Silva, J; Dias, F; Alexandre Lima; Ana Teodoro; Barres, O; Cauzid, J; Perrotta, MN; Roda Robles, E; Anjos Ribeiro
Spectral Library of Plant Species from Montesinho Natural Park in Portugal (2024)
Artigo em Revista Científica Internacional
Pôças, I; de Almeida, CR; Arenas-Castro, S; Campos, JC; Garcia, N; Alírio, J; sillero, n; Ana Teodoro
Labelled Indoor Point Cloud Dataset for BIM Related Applications (2023)
Artigo em Revista Científica Internacional
Abreu, N; Souza, R; Pinto, A; Aníbal Castilho Coimbra de Matos; Pires, M
Data Employed in the Construction of a Composite Protein Database for Proteogenomic Analyses of Cephalopods Salivary Apparatus (2020)
Artigo em Revista Científica Internacional
Almeida, D; Domínguez-Pérez, D; Matos, A; Agüero-Chapin, G; Castaño, Y; Vitor Vasconcelos; Alexandre Campos; Agostinho Antunes
Recomendar Página Voltar ao Topo
Copyright 1996-2025 © Faculdade de Direito da Universidade do Porto  I Termos e Condições  I Acessibilidade  I Índice A-Z
Página gerada em: 2025-07-31 às 01:34:48 | Política de Privacidade | Política de Proteção de Dados Pessoais | Denúncias