Armazenamento e Recuperação de Informação I
Ocorrência: 2009/2010 - 1S
Ciclos de Estudo/Cursos
Língua de trabalho
Português
Objetivos
No final desta disciplina o aluno deverá ser capaz de:
-Identificar tarefas de recuperação de informação realizadas com ferramentas específicas ou embebidas em serviços;
-Descrever o funcionamento de uma ferramenta de pesquisa e os seus componentes;
-Distinguir os modelos clássicos de recuperação de informação, identificando os seus princípios, os modelos de documentos e as medidas de semelhança;
-Usar programas de processamento de texto com vista à sua indexação e prever os resultados do processamento;
-Distinguir nas ferramentas de pesquisa as tarefas de indexação de colecções de documentos das de resposta a interrogações;
-Realizar tarefas de recuperação de informação na web usando as pesquisas avançadas dos motores;
-Dada uma colecção de documentos e uma tarefa de recuperação, criar um modelo apropriado dos documentos e especificar um método automático para a sua extracção;
-Calcular os valores de diversas medidas de referência na avaliação de sistemas de recuperação;
-Participar em tarefas de avaliação da recuperação de informação, fornecendo informação de relevância de documentos para tópicos seleccionados;
-Relacionar a recuperação de informação textual com as suas extensões para voz e imagem, identificando os problemas em aberto.
Programa
O armazenamento e recuperação de informação e as suas tarefas. Recuperação de informação versus recuperação de dados. O desenvolvimento da recuperação de informação. O processo de recuperação de informação. Características gerais dos sistemas de recuperação.
Modelos de recuperação de informação. Modelo Booleano, modelo vectorial e modelo probabilístico.
Processamento de documentos e de interrogações: análise léxica, extracção de raízes, compressão. Construção de índices.
Pesquisa sobre índices. Pesos e ordenação de documentos.
Recuperação de informação na web. "Crawling" e indexação. Análise de ligações.
Avaliação de sistemas de recuperação de informação. Colecções de teste, tópicos e avaliações de relevância.
Bibliografia Obrigatória
Baeza-Yates, Ricardo;
Modern information retrieval. ISBN: 0-201-39829-X
Manning, Christopher D.;
Introduction to information retrieval. ISBN: 978-0-521-86571-5
Métodos de ensino e atividades de aprendizagem
As aulas teóricas são usadas para exposição da matéria, discussão de temas e apresentação de trabalhos.
Nas aulas práticas os alunos vão realizar exercícios de aplicação dos conceitos e técnicas
estudados. As aulas no final do semestre são reservada para a apresentação de um trabalho prático.
Tipo de avaliação
Avaliação distribuída com exame final
Componentes de Avaliação
| Descrição |
Tipo |
Tempo (Horas) |
Peso (%) |
Data Conclusão |
| Participação presencial (estimativa) |
Participação presencial |
46,00 |
|
|
| Projecto: Avaliação de Recuperação na Web |
Trabalho escrito |
30,00 |
|
2009-12-11 |
| Exercícios das aulas práticas |
Teste |
30,00 |
|
2009-12-17 |
|
Total: |
- |
0,00 |
|
Componentes de Ocupação
| Descrição |
Tipo |
Tempo (Horas) |
Data Conclusão |
| Manutenção de dossier |
Estudo autónomo |
30 |
2009-12-17 |
| Estudo |
Estudo autónomo |
53 |
2010-01-08 |
|
Total: |
83,00 |
|
Obtenção de frequência
Mínimos para obtenção de frequência:
50% avaliação prática
50% avaliação teórica
Fórmula de cálculo da classificação final
Nota final = 50% * nota do exame + 10% * exercícios aulas práticas + 30% * mini-projecto + 10% * dossier da disciplina.
Provas e trabalhos especiais
Não há. Os alunos que frequentam ao abrigo de regimes que não o ordinário têm de realizar os trabalhos práticos da disciplina na época em que estes têm lugar.
Avaliação especial (TE, DA, ...)
Os exames ao abrigo de regimes especiais requerem a prévia realização dos trabalhos previstos na disciplina, na época a isso destinada.
Melhoria de classificação
A nota de exame pode ser melhorada em época de recurso. A melhoria da classificação prática requer a inscrição na edição seguinte da disciplina, de forma a cumprir os requisitos estabelecidos.