Saltar para:
Logótipo
Você está em: Início » Publicações » Visualização » Statistically Robust Evaluation of Stream-Based Recommender Systems

Statistically Robust Evaluation of Stream-Based Recommender Systems

Título
Statistically Robust Evaluation of Stream-Based Recommender Systems
Tipo
Artigo em Revista Científica Internacional
Ano
2021
Autores
Vinagre, J
(Autor)
Outra
A pessoa não pertence à instituição. A pessoa não pertence à instituição. A pessoa não pertence à instituição. Ver página do Authenticus Sem ORCID
Jorge, AM
(Autor)
FCUP
Ver página pessoal Sem permissões para visualizar e-mail institucional Pesquisar Publicações do Participante Ver página do Authenticus Sem ORCID
Rocha, C
(Autor)
Outra
Ver página pessoal Sem permissões para visualizar e-mail institucional Pesquisar Publicações do Participante Ver página do Authenticus Sem ORCID
João Gama
(Autor)
FEP
Revista
Vol. 33
Páginas: 2971-2982
ISSN: 1041-4347
Editora: IEEE
Outras Informações
ID Authenticus: P-00R-FP4
Abstract (EN): Online incremental models for recommendation are nowadays pervasive in both the industry and the academia. However, there is not yet a standard evaluation methodology for the algorithms that maintain such models. Moreover, online evaluation methodologies available in the literature generally fall short on the statistical validation of results, since this validation is not trivially applicable to stream-based algorithms. We propose a k-fold validation framework for the pairwise comparison of recommendation algorithms that learn from user feedback streams, using prequential evaluation. Our proposal enables continuous statistical testing on adaptive-size sliding windows over the outcome of the prequential process, allowing practitioners and researchers to make decisions in real time based on solid statistical evidence. We present a set of experiments to gain insights on the sensitivity and robustness of two statistical tests-McNemar's and Wilcoxon signed rank-in a streaming data environment. Our results show that besides allowing a real-time, fine-grained online assessment, the online versions of the statistical tests are at least as robust as the batch versions, and definitely more robust than a simple prequential single-fold approach.
Idioma: Inglês
Tipo (Avaliação Docente): Científica
Nº de páginas: 12
Documentos
Não foi encontrado nenhum documento associado à publicação.
Publicações Relacionadas

Da mesma revista

ORDER STRUCTURE OF SYMBOLIC ASSERTION OBJECTS (1994)
Outra Publicação em Revista Científica Internacional
brito, p
Learning under Concept Drift: A Review (2019)
Artigo em Revista Científica Internacional
Lu, J; Liu, AJ; Dong, F; Gu, F; João Gama; Zhang, GQ
Hierarchical clustering of time-series data streams (2008)
Artigo em Revista Científica Internacional
Pedro Pereira Rodrigues; Joao Gama; Joao Pedro Pedroso
Evaluation of Multiclass Novelty Detection Algorithms for Data Streams (2015)
Artigo em Revista Científica Internacional
de Faria, ER; Goncalves, IR; João Gama; de Leon Ferreira Carvalho, ACPDF
Evaluating variable-length Markov chain models for analysis of user Web navigation sessions (2007)
Artigo em Revista Científica Internacional
José Luís Moura Borges; Levene, M

Ver todas (8)

Recomendar Página Voltar ao Topo
Copyright 1996-2024 © Faculdade de Medicina da Universidade do Porto  I Termos e Condições  I Acessibilidade  I Índice A-Z  I Livro de Visitas
Página gerada em: 2024-10-04 às 08:13:43
Política de Utilização Aceitável | Política de Proteção de Dados Pessoais | Denúncias | Política de Captação e Difusão da Imagem Pessoal em Suporte Digital