Você está em: Início > Publicações > Visualização > A customized residual neural network and bi-directional gated recurrent unit-based automatic speech recognition model

Publicação

Pesquisa de Publicações

A customized residual neural network and bi-directional gated recurrent unit-based automatic speech recognition model

Título

A customized residual neural network and bi-directional gated recurrent unit-based automatic speech recognition modelExportar publicação no formato APA Exportar publicação no formato EXCEL Exportar publicação no formato RIS

Tipo

Artigo em Revista Científica Internacional

Data

2022-04

Título

A customized residual neural network and bi-directional gated recurrent unit-based automatic speech recognition model

Tipo

Artigo em Revista Científica Internacional

Ano

2022-04

Autores

Selim Reza

(Autor)

Outra

Ver página pessoal Sem permissões para visualizar e-mail institucional Pesquisar Publicações do Participante Sem AUTHENTICUS Sem ORCID

Marta Campos Ferreira

(Autor)

FEUP

Ver página pessoal Sem permissões para visualizar e-mail institucional Pesquisar Publicações do Participante Ver página do Authenticus Ver página ORCID

J.J.M. Machado

(Autor)

FEUP

Ver página pessoal Sem permissões para visualizar e-mail institucional Pesquisar Publicações do Participante Ver página do Authenticus Ver página ORCID

João Manuel R. S. Tavares

(Autor)

FEUP

Ver página pessoal Sem permissões para visualizar e-mail institucional Pesquisar Publicações do Participante Ver página do Authenticus Ver página ORCID

Revista

Título: Expert Systems with ApplicationsImportada do Authenticus Pesquisar Publicações da Revista

Vol. 215 Nº 119293

Páginas: 1-10

ISSN: 0957-4174

Editora: Elsevier

Indexação

ISI Web of Knowledge - 12 Citações

ISI Web of Science

Scopus - 19 Citações

Clarivate Analytics

Classificação Científica

CORDIS: Ciências Tecnológicas

FOS: Ciências da engenharia e tecnologias

Projetos Associados

Safe Cities - Safe Cities - Inovação para Construir Cidades Seguras

Outras Informações

ID Authenticus: P-00X-FZ7

DOI: 10.1016/j.eswa.2022.119293

Abstract (EN): Speech recognition aims to convert human speech into text and has applications in security, healthcare, commerce, automobiles, and technology, just to name a few. Inserting residual neural networks before recurrent neural network cells improves accuracy and cuts training time by a good margin. Furthermore, layer normalization instead of batch normalization is more effective in model training and performance enhancement. Also, the size of the datasets presents tremendous influences in achieving the best performance. Leveraging these tricks, this article proposes an automatic speech recognition model with a stacked five layers of customized Residual Convolution Neural Network and seven layers of Bi-Directional Gated Recurrent Units, including a logarithmic so f tmax for the model output. Each of them incorporates a learnable per-element affine parameter-based layer normalization technique. The training and testing of the new model were conducted on the LibriSpeech corpus and LJ Speech dataset. The experimental results demonstrate a character error rate (CER) of 4.7 and 3.61% on the two datasets, respectively, with only 33 million parameters without the requirement of any external language model.

Idioma: Inglês

Tipo (Avaliação Docente): Científica

Nº de páginas: 10

Documentos

Nome do Ficheiro	Descrição	Tamanho
1-s2.0-S0957417422023119	Paper	2250.21 KB
paper	1st Page	183.26 KB

Publicações Relacionadas

Dos mesmos autores

Traffic State Prediction Using One-Dimensional Convolution Neural Networks and Long Short-Term Memory (2022)
Artigo em Revista Científica Internacional
Selim Reza; Marta Campos Ferreira; José J. M. Machado; João Manuel R. S. Tavares

Road Traffic Events Monitoring Using a Multi-Head Attention Mechanism-Based Transformer and Temporal Convolutional Networks (2025)
Artigo em Revista Científica Internacional
Selim Reza; Marta Campos Ferreira; J.J.M. Machado; João Manuel R. S. Tavares

Enhancing intelligent transportation systems with a more efficient model for long-term traffic predictions based on an attention mechanism and a residual temporal convolutional network (2025)
Artigo em Revista Científica Internacional
Selim Reza; Marta Campos Ferreira; J.J.M. Machado; João Manuel R. S. Tavares

An Actor-Critic-based adapted Deep Reinforcement Learning model for multi-step traffic state prediction (2025)
Artigo em Revista Científica Internacional
Selim Reza; Marta Campos Ferreira; J.J.M. Machado; João Manuel R. S. Tavares

A multi-head attention-based transformer model for traffic flow forecasting with a comparative analysis to recurrent neural networks (2022)
Artigo em Revista Científica Internacional
Selim Reza; Marta Campos Ferreira; José Joaquim M. Machado; João Manuel R. S. Tavares

Ver todas (6)

Das mesmas áreas científicas

Utilização dos Campos de Granitado LASER (SPECKLE) na Medição de Deslocamentos e Deformações num Plano (1984)
Tese
A. C. Marques Pinho; J. F. Silva Gomes

Utilização de Técnicas Interferométricas na Medição de Deformações (no Plano) em Estruturas Sujeitas a Solicitações Térmicas e Mecânicas (1996)
Tese
António Teixeira; J. F. Silva Gomes

Utilização da Interferometria de Granitado Laser (ESPI) na Determinação dos Modos e Frequências Próprias de Vibração de Placas (1987)
Tese
Pedro M. B. Pimentel; J. F. Silva Gomes

Transformação de um Objecto da Industria Extractiva em Sistema. Algumas consequências. (1998)
Tese
Alexandre Leite

Solicitações Locais em Cascas Finas de Geometria Esférica e Cilíndrica (1993)
Tese
Nuno Rilo; J. F. Silva Gomes

Ver todas (2344)

Da mesma revista

Towards a data privacy-predictive performance trade-off (2023)
Outra Publicação em Revista Científica Internacional
Carvalho, T; Moniz, N; Faria, P; antunes, l

Learning path personalization and recommendation methods: A survey of the state-of-the-art (2020)
Outra Publicação em Revista Científica Internacional
Nabizadeh, AH; José Paulo Leal; Rafsanjani, HN; Shah, RR

Time-evolving O-D matrix estimation using high-speed GPS data streams (2016)
Artigo em Revista Científica Internacional
Luís Moreira-Matias; João Gama; Michel Ferreira; João Mendes-Moreira; Luís Damas

Three-dimensional guillotine cutting problems with constrained patterns: MILP formulations and a bottom-up algorithm (2021)
Artigo em Revista Científica Internacional
Mateus Martin; José Fernando Oliveira; Elsa Silva; Reinaldo Morabito; Pedro Munari

The 'Healthcare Access and Quality Index' revisited: A fuzzy data envelopment analysis approach (2024)
Artigo em Revista Científica Internacional
Pereira, MA; Ana Maria Cunha Ribeiro dos Santos Ponces Camanho

Ver todas (57)

Recomendar Página Voltar ao Topo

Copyright 1996-2025 © Centro de Desporto da Universidade do Porto I Termos e Condições I Acessibilidade I Índice A-Z
Página gerada em: 2025-12-04 às 11:19:18 | Política de Privacidade | Política de Proteção de Dados Pessoais | Denúncias | Livro Amarelo Eletrónico