Saltar para:
Logótipo
Você está em: Início > M.EIC003

Processamento e Recuperação de Informação

Código: M.EIC003     Sigla: PRI

Áreas Científicas
Classificação Área Científica
OFICIAL Sistemas de Informação

Ocorrência: 2022/2023 - 1S Ícone do Moodle

Ativa? Sim
Página Web: https://moodle.up.pt/course/view.php?id=2177
Unidade Responsável: Departamento de Engenharia Informática
Curso/CE Responsável: Mestrado em Engenharia Informática e Computação

Ciclos de Estudo/Cursos

Sigla Nº de Estudantes Plano de Estudos Anos Curriculares Créditos UCN Créditos ECTS Horas de Contacto Horas Totais
M.EIC 148 Plano de estudos oficial 1 - 6 52 162
Mais informaçõesA ficha foi alterada no dia 2022-09-30.

Campos alterados: Fórmula de cálculo da classificação final, Obtenção de frequência, Melhoria de classificação

Língua de trabalho

Inglês

Objetivos

A unidade curricular de PRI tem como objetivo preparar os estudantes para conhecer, compreender, desenhar e desenvolver soluções para o processamento e recuperação de informação.

Os objetivos específicos são:

  1. Sensibilizar os estudantes para os desafios associados à construção de sistemas de pesquisa de informação;
  2. Familiar os estudantes com os principais conceitos e técnicas associadas ao processamento e recuperação de informação;
  3. Capacitar os estudantes para desenhar, implementar e avaliar sistemas de pesquisa de informação sobre coleções de documentos.

Resultados de aprendizagem e competências

Ao completar esta unidade curricular, o estudante deve ser capaz de projetar e implementar um sistema para o processamento e recuperação de informação. Em particular, o estudante deve ser capaz de:

  • Identificar e descrever as principais tarefas associadas ao processamento e recuperação de informação;
  • Descrever a arquitetura e funcionamento de um sistema de pesquisa de informação;
  • Descrever as tarefas associadas às fases de processamento de uma coleção (offline) e de processamento de interrogações (online);
  • Distinguir os diferentes modelos de recuperação de informação, identificando os seus princípios, os modelos para a representação de documentos, e as medidas de semelhança;
  • Descrever e implementar diferentes técnicas para a indexação de informação;
  • Descrever e implementar diferentes técnicas para a recuperação e ordenação de resultados;

Modo de trabalho

Presencial

Pré-requisitos (conhecimentos prévios) e co-requisitos (conhecimentos simultâneos)

Programação: conhecimento e prática com linguagens de programação para o desenvolvimento de aplicações.

Bases de Dados: conhecimento e prática de modelação de dados em UML.

Programa

A área do processamento e recuperação de informação

  • Recuperação de informação versus recuperação de dados;
  • O desenvolvimento da área da recuperação de informação;
  • Tarefas de recuperação de informação;
  • O processo de recuperação de informação.

Arquitetura dos sistemas de recuperação de informação

  • Componentes de um sistema de pesquisa;
  • Recolha de informação: seleção, aquisição e armazenamento;
  • Processamento de texto: análise lexical, extração de raízes, compressão;
  • Indexação: índices invertidos, construção e acesso;
  • Processamento das interrogações, interação, ordenação e avaliação dos resultados.

Modelos de recuperação

  • Modelo Booleano, modelo vetorial e modelo probabilístico;
  • Representação de documentos;
  • Medidas de semelhança.

Recuperação de informação na web

  • Análise de ligações;
  • Algoritmos HITS e PageRank.

Avaliação de sistemas de recuperação de informação

  • Coleções de teste, tópicos e avaliações de relevância;
  • Medidas para a avaliação de sistemas de pesquisa.

Bibliografia Obrigatória

Christopher D. Manning, Prabhakar Raghavan, Hinrich Schütze; Introduction to Information Retrieval, Cambridge University Press, 2008. ISBN: 0521865719
W. Bruce Croft; Search engines. ISBN: 978-0-13-136489-9

Bibliografia Complementar

Ricardo Baeza-Yates; Modern information retrieval. ISBN: 978-0321416919
Marti Hearst; Search User Interfaces, Cambridge University Press, 2009
Martin Kleppmann; Designing Data-Intensive Applications, O'Reilly, 2017. ISBN: 9781449373320

Métodos de ensino e atividades de aprendizagem

Os tópicos do programa são expostos numa série de sessões tutoriais (exposição teórica e trabalho laboratorial). Cada grupo de estudantes define e realiza um projeto ao longo do semestre, com parte do desenvolvimento, acompanhamento, e avaliação, realizadas em aula.

Projeto: desenho e implementação de um sistema de processamento e pesquisa de informação desenvolvido em grupos de estudantes. O projeto está organizado em entregas e apresentações parciais, que correspondem às fases de desenvolvimento do projeto.

O desenvolvimento do projeto será acompanhado durante as aulas teórico-práticas, e avaliado com base no acompanhamento, num relatório técnico, e na apresentação final.

Os conceitos teóricos são avaliados através de um exame final, com perguntas de escolha múltipla, incluindo perguntas abertas.

Software

OpenRefine
Apache Lucene
Apache Solr
Docker

Palavras Chave

Ciências Físicas > Ciência de computadores > Informática

Tipo de avaliação

Avaliação distribuída com exame final

Componentes de Avaliação

Designação Peso (%)
Trabalho escrito 60,00
Exame 40,00
Total: 100,00

Componentes de Ocupação

Designação Tempo (Horas)
Elaboração de projeto 70,00
Estudo autónomo 40,00
Frequência das aulas 52,00
Total: 162,00

Obtenção de frequência

Existem duas condições para a obtenção de frequência. O estudante:

  • (1) não pode exceder o número limite de faltas permitidas; e
  • (2) tem de obter a classificação mínima definida no projeto.

Fórmula de cálculo da classificação final

A nota final será calculada usando a fórmula

NF = 60% Projeto + 40% Exame

A classificação final do projeto pode variar de elemento para elemento do mesmo grupo, em mais ou menos 3 valores, com base na opinião dos docentes e na autoavaliação e heteroavaliação a realizar internamente em cada grupo.

A aprovação na unidade curricular está condicionada à obtenção de uma avaliação individual mínima de 40% em cada uma das componentes de avaliação (projeto e exame).

Provas e trabalhos especiais

Não há provas nem trabalhos especiais.

Avaliação especial (TE, DA, ...)

A avaliação distribuída, realizada durante o semestre de funcionamento da unidade curricular, é exigida a todos os estudantes, independentemente do regime de inscrição.

Os trabalhadores estudantes e equivalentes dispensados das aulas devem, com periodicidade a combinar com os docentes, apresentar a evolução dos seus trabalhos, assim como devem fazer a apresentação destes, simultaneamente com os estudantes ordinários, e realizar as provas teóricas de avaliação individual previstas.

Melhoria de classificação

Apenas a componente individual (exame) pode ser melhorada.

Recomendar Página Voltar ao Topo
Copyright 1996-2024 © Faculdade de Engenharia da Universidade do Porto  I Termos e Condições  I Acessibilidade  I Índice A-Z  I Livro de Visitas
Página gerada em: 2024-07-23 às 06:15:46 | Política de Utilização Aceitável | Política de Proteção de Dados Pessoais | Denúncias