Saltar para:
Logótipo
Comuta visibilidade da coluna esquerda
Você está em: Início > Publicações > Visualização > Neural network models for whisper to normal speech conversion

Publicações

Neural network models for whisper to normal speech conversion

Título
Neural network models for whisper to normal speech conversion
Tipo
Artigo em Revista Científica Internacional
Ano
2025
Autores
Yamamura, F
(Autor)
Outra
A pessoa não pertence à instituição. A pessoa não pertence à instituição. A pessoa não pertence à instituição. Sem AUTHENTICUS Sem ORCID
Scalassara, R
(Autor)
Outra
A pessoa não pertence à instituição. A pessoa não pertence à instituição. A pessoa não pertence à instituição. Sem AUTHENTICUS Sem ORCID
Oliveira, A
(Autor)
Outra
A pessoa não pertence à instituição. A pessoa não pertence à instituição. A pessoa não pertence à instituição. Sem AUTHENTICUS Sem ORCID
Revista
Indexação
Publicação em Scopus Scopus - 0 Citações
Outras Informações
ID Authenticus: P-018-HWJ
Abstract (EN): Whispers are common and essential for secondary communication. Nonetheless, individuals with aphonia, including laryngectomees, rely on whispers as their primary means of communication. Due to the distinct features between whispered and regular speech, debates have emerged in the field of speech recognition, highlighting the challenge of effectively converting between them. This study investigates the characteristics of whispered speech and proposes a system for converting whispered vowels into normal ones. The system is developed using multilayer perceptron networks and two types of generative adversarial networks. Three metrics are analyzed to evaluate the performance of the system: mel-cepstral distortion, root mean square error of the fundamental frequency, and accuracy with f1-score of a vowel classifier. Overall, the perceptron networks demonstrated better results, with no significant differences observed between male and female voices or the presence/absence of speech silence, except for improved accuracy in estimating the fundamental frequency during the conversion process. © 2025, Universidade do Porto - Faculdade de Engenharia. All rights reserved.
Idioma: Inglês
Tipo (Avaliação Docente): Científica
Nº de páginas: 13
Documentos
Não foi encontrado nenhum documento associado à publicação.
Publicações Relacionadas

Da mesma revista

Review of research studies on biomechanics of swallowing and dysphagia (2019)
Outra Publicação em Revista Científica Internacional
Almeida, J; Renato Natal Jorge
Editorial of Special Issue: Symposium on Environmental Engineering (SEE) ¿ 4th Doctoral Congress in Engineering (DCE21) (2022)
Outra Publicação em Revista Científica Internacional
Silva, Adrian; Arminda Alves
Editorial (2021)
Outra Publicação em Revista Científica Internacional
Lucas F. M. da Silva; António J. M. Ferreira
Editorial (2024)
Outra Publicação em Revista Científica Internacional
Claudia G Silva; Manrique, Y.A.; Ricardo J. Santos
Editorial (2022)
Outra Publicação em Revista Científica Internacional
Claudia G Silva; Santos, R

Ver todas (136)

Recomendar Página Voltar ao Topo
Copyright 1996-2025 © Faculdade de Direito da Universidade do Porto  I Termos e Condições  I Acessibilidade  I Índice A-Z
Página gerada em: 2025-09-08 às 02:13:56 | Política de Privacidade | Política de Proteção de Dados Pessoais | Denúncias