Saltar para:
Logótipo
Comuta visibilidade da coluna esquerda
Você está em: Início > Publicações > Visualização > A Bootstrapping Approach for Training a NER with Conditional Random Fields

A Bootstrapping Approach for Training a NER with Conditional Random Fields

Título
A Bootstrapping Approach for Training a NER with Conditional Random Fields
Tipo
Artigo em Livro de Atas de Conferência Internacional
Ano
2011
Autores
sarmento, l
(Autor)
Outra
A pessoa não pertence à instituição. A pessoa não pertence à instituição. A pessoa não pertence à instituição. Sem AUTHENTICUS Sem ORCID
oliveira, e
(Autor)
FEUP
Ata de Conferência Internacional
Páginas: 664-678
15th Portuguese Conference on Artificial Intelligence (EPIA 2011)
Lisbon, PORTUGAL, OCT 10-13, 2011
Indexação
Classificação Científica
FOS: Ciências exactas e naturais > Ciências da computação e da informação
Outras Informações
ID Authenticus: P-002-VZ3
Abstract (EN): In this paper we present a bootstrapping approach for training a Named Entity Recognition (NER) system. Our method starts by annotating persons' names on a dataset of 50,000 news items. This is performed using a simple dictionary-based approach. Using such training set we build a classification model based on Conditional Random Fields (CRF). We then use the inferred classification model to perform additional annotations of the initial seed corpus, which is then used for training a new classification model. This cycle is repeated until the NER model stabilizes. We evaluate each of the bootstrapping iterations by calculating: (i) the precision and recall of the NER model in annotating a small gold-standard collection (HAREM); (ii) the precision and recall of the CRF bootstrapping annotation method over a small sample of news; and (iii) the correctness and the number of new names identified. Additionally, we compare the NER model with a dictionary-based approach, our baseline method. Results show that our bootstrapping approach stabilizes after 7 iterations, achieving high values of precision (83%) and recall (68%).
Idioma: Inglês
Tipo (Avaliação Docente): Científica
Contacto: jft@fe.up.pt; las@fe.up.pt; eco@fe.up.pt
Nº de páginas: 15
Documentos
Não foi encontrado nenhum documento associado à publicação.
Publicações Relacionadas

Dos mesmos autores

Semi-Automatic Creation of a Reference News Corpus for Fine-Grained Multi-Label Scenarios (2011)
Artigo em Livro de Atas de Conferência Internacional
teixeira, j; sarmento, l; oliveira, e
Comparing Verb Synonym Resources for Portuguese (2010)
Artigo em Livro de Atas de Conferência Internacional
teixeira, j; sarmento, l; oliveira, e
Recomendar Página Voltar ao Topo
Copyright 1996-2025 © Centro de Desporto da Universidade do Porto I Termos e Condições I Acessibilidade I Índice A-Z
Página gerada em: 2025-10-17 às 00:28:22 | Política de Privacidade | Política de Proteção de Dados Pessoais | Denúncias | Livro Amarelo Eletrónico