Saltar para:
Logótipo
Comuta visibilidade da coluna esquerda
Você está em: Início > Publicações > Visualização > Term Weighting Based on Document Revision History

Publicações

Term Weighting Based on Document Revision History

Título
Term Weighting Based on Document Revision History
Tipo
Artigo em Revista Científica Internacional
Ano
2011
Autores
Sérgio Nunes
(Autor)
FEUP
Ver página pessoal Sem permissões para visualizar e-mail institucional Pesquisar Publicações do Participante Ver página do Authenticus Sem ORCID
Cristina Ribeiro
(Autor)
FEUP
Revista
Vol. 62 12
Páginas: 2471-2478
ISSN: 1532-2882
Indexação
Publicação em ISI Web of Science ISI Web of Science
INSPEC
COMPENDEX
Classificação Científica
FOS: Ciências da engenharia e tecnologias > Engenharia electrotécnica, electrónica e informática
Outras Informações
ID Authenticus: P-002-JAF
Abstract (EN): In real-world information retrieval systems, the underlying document collection is rarely stable or definitive. This work is focused on the study of signals extracted from the content of documents at different points in time for the purpose of weighting individual terms in a document. The basic idea behind our proposals is that terms that have existed for a longer time in a document should have a greater weight. We propose 4 term weighting functions that use each document's history to estimate a current term score. To evaluate this thesis, we conduct 3 independent experiments using a collection of documents sampled from Wikipedia. In the first experiment, we use data from Wikipedia to judge each set of terms. In a second experiment, we use an external collection of tags from a popular social bookmarking service as a gold standard. In the third experiment, we crowdsource user judgments to collect feedback on term preference. Across all experiments results consistently support our thesis. We show that temporally aware measures, specifically the proposed revision term frequency and revision term frequency span, outperform a term-weighting measure based on raw term frequency alone.
Idioma: Inglês
Tipo (Avaliação Docente): Científica
Nº de páginas: 8
Documentos
Não foi encontrado nenhum documento associado à publicação com acesso permitido.
Publicações Relacionadas

Dos mesmos autores

Information Retrieval on Time-Dependent Collections (2010)
Tese
Sérgio Nunes; Cristina Ribeiro; Gabriel David
The impact of time in link-based Web ranking (2013)
Artigo em Revista Científica Internacional
Sérgio Nunes; Cristina Ribeiro; Gabriel David
Improving Web user experience with document activity sparklines (2009)
Artigo em Livro de Atas de Conferência Nacional
Sérgio Nunes; Cristina Ribeiro; Gabriel David
WikiChanges : exposing Wikipedia revision activity (2008)
Artigo em Livro de Atas de Conferência Internacional
Sérgio Sobral Nunes; Maria Cristina de Carvalho Alves Ribeiro; Gabriel de Sousa Torcato David
Using temporal evidence in blog search (2009)
Artigo em Livro de Atas de Conferência Internacional
Sérgio Nunes; Cristina Ribeiro; Gabriel David

Ver todas (10)

Da mesma revista

Measuring the value of health query translation: An analysis by user language proficiency (2013)
Artigo em Revista Científica Internacional
Carla Lopes; Cristina Ribeiro
Recomendar Página Voltar ao Topo
Copyright 1996-2025 © Faculdade de Direito da Universidade do Porto  I Termos e Condições  I Acessibilidade  I Índice A-Z
Página gerada em: 2025-09-13 às 13:51:55 | Política de Privacidade | Política de Proteção de Dados Pessoais | Denúncias | Livro Amarelo Eletrónico