Saltar para:
Logótipo
Comuta visibilidade da coluna esquerda
Você está em: Início > Publicações > Visualização > Static features in real-time recognition of isolated vowels at high pitch

Publicações

Static features in real-time recognition of isolated vowels at high pitch

Título
Static features in real-time recognition of isolated vowels at high pitch
Tipo
Artigo em Revista Científica Internacional
Ano
2007
Revista
Vol. 122 4
Páginas: 2389-2404
ISSN: 0001-4966
Classificação Científica
FOS: Ciências da engenharia e tecnologias > Outras ciências da engenharia e tecnologias
Outras Informações
ID Authenticus: P-004-78P
Abstract (EN): This paper addresses the problem of automatic identification of vowels uttered in isolation by female and child speakers. In this case, the magnitude spectrum of voiced vowels is sparsely sampled since only frequencies at integer multiples of F0 are significant. This impacts negatively on the performance of vowel identification techniques that either ignore pitch or rely on global shape models. A new pitch-dependent approach to vowel identification is proposed that emerges from the concept of timbre and that defines perceptual spectral clusters (PSC) of harmonic partials. A representative set of static PSC-related features are estimated and their performance is evaluated in automatic classification tests using the Mahalanobis distance. Linear prediction features and Mel-frequency cepstral coefficients (MFCC) coefficients are used as a reference and a database of five (Portuguese) natural vowel sounds uttered by 44 speakers (including 27 child speakers) is used for training and testing the Gaussian models. Results indicate that perceptual spectral cluster (PSC) features perform better than plain linear prediction features, but perform slightly worse than MFCC features. However, PSC features have the potential to take full advantage of the pitch structure of voiced vowels, namely in the analysis of concurrent voices, or by using pitch as a normalization parameter. (C) 2007 Acoustical Society of America.
Idioma: Inglês
Tipo (Avaliação Docente): Científica
Nº de páginas: 16
Documentos
Não foi encontrado nenhum documento associado à publicação.
Publicações Relacionadas

Dos mesmos autores

Processamento Digital de Sinal, Aulas Práticas (2004)
Publicação Didática
Francisco Restivo; Aníbal Ferreira
A Review of Voicing Decision in Whispered Speech: From Rules to Machine Learning (2025)
Outra Publicação em Revista Científica Internacional
da Silva, JMPP; Duarte Nunes, G; Aníbal Ferreira

Ver todas (144)

Da mesma revista

Relationships between subjective and objective acoustical measures in churches (1997)
Artigo em Revista Científica Internacional
António P. Carvalho; António E. Morgado; Luís Henrique
Musicians and non-musicians are equally adept at perceiving masked speech (2015)
Artigo em Revista Científica Internacional
Dana Boebinger; Samuel Evans; Stuart Rosen; César F. Lima; Tom Manly; Sophie K. Scott
Evaluation of the successive approximations method for acoustic streaming numerical simulations (2016)
Artigo em Revista Científica Internacional
S. O. Catarino; G. Minas; J. M. Miranda
Recomendar Página Voltar ao Topo
Copyright 1996-2025 © Faculdade de Direito da Universidade do Porto  I Termos e Condições  I Acessibilidade  I Índice A-Z
Página gerada em: 2025-07-24 às 06:35:28 | Política de Privacidade | Política de Proteção de Dados Pessoais | Denúncias