Saltar para:
Logótipo
Você está em: Início > Publicações > Visualização > Optimization of Image Processing Algorithms for Character Recognition in Cultural Typewritten Documents

Optimization of Image Processing Algorithms for Character Recognition in Cultural Typewritten Documents

Título
Optimization of Image Processing Algorithms for Character Recognition in Cultural Typewritten Documents
Tipo
Artigo em Revista Científica Internacional
Ano
2023
Autores
Dias, M
(Autor)
Outra
A pessoa não pertence à instituição. A pessoa não pertence à instituição. A pessoa não pertence à instituição. Ver página do Authenticus Sem ORCID
Carla Teixeira Lopes
(Autor)
FEUP
Revista
A Revista está pendente de validação pelos Serviços Administrativos.
Vol. 16
Páginas: 77:1-25
ISSN: 1556-4673
Outras Informações
ID Authenticus: P-00Z-EH9
Abstract (EN): Linked data is used in various fields as a new way of structuring and connecting data. Cultural heritage institutions have been using linked data to improve archival descriptions and facilitate the discovery of information. Most archival records have digital representations of physical artifacts in the form of scanned images that are non-machine-readable. Optical Character Recognition (OCR) recognizes text in images and translates it into machine-encoded text. This article evaluates the impact of image processing methods and parameter tuning in OCR applied to typewritten cultural heritage documents. The approach uses a multi-objective problem formulation to minimize Levenshtein edit distance and maximize the number of words correctly identified with a non-dominated sorting genetic algorithm (NSGA-II) to tune the methods' parameters. Evaluation results show that parameterization by digital representation typology benefits the performance of image pre-processing algorithms in OCR. Furthermore, our findings suggest that employing image pre-processing algorithms in OCR might be more suitable for typologies where the text recognition task without pre-processing does not produce good results. In particular, Adaptive Thresholding, Bilateral Filter, and Opening are the best-performing algorithms for the theater plays' covers, letters, and overall dataset, respectively, and should be applied before OCR to improve its performance.
Idioma: Inglês
Tipo (Avaliação Docente): Científica
Nº de páginas: 25
Documentos
Não foi encontrado nenhum documento associado à publicação.
Publicações Relacionadas

Dos mesmos autores

Mining Typewritten Digital Representations to Support Archival Description (2022)
Artigo em Livro de Atas de Conferência Internacional
Dias, M; Carla Teixeira Lopes
Cross-Lingual Entity Linking Using GPT Models in Radiology Abstracts (2025)
Artigo em Livro de Atas de Conferência Internacional
Dias, M; Carla Teixeira Lopes

Da mesma revista

Moving from ISAD(G) to a CIDOC CRM-based Linked Data Model in the Portuguese Archives (2023)
Artigo em Revista Científica Internacional
Koch, I; Carla Teixeira Lopes; Cristina Ribeiro
Designing User Interaction with Linked Data in Historical Archives (2022)
Artigo em Revista Científica Internacional
Guedes, C; Giesteira, Bruno; Sérgio Nunes
Recomendar Página Voltar ao Topo
Copyright 1996-2025 © Faculdade de Medicina Dentária da Universidade do Porto  I Termos e Condições  I Acessibilidade  I Índice A-Z
Página gerada em: 2025-09-09 às 14:02:47 | Política de Privacidade | Política de Proteção de Dados Pessoais | Denúncias | Livro Amarelo Eletrónico