Saltar para:
Logótipo
Você está em: Início > M.EIC003

Processamento e Recuperação de Informação

Código: M.EIC003     Sigla: PRI

Áreas Científicas
Classificação Área Científica
OFICIAL Sistemas de Informação

Ocorrência: 2024/2025 - 1S Ícone do Moodle

Ativa? Sim
Unidade Responsável: Departamento de Engenharia Informática
Curso/CE Responsável: Mestrado em Engenharia Informática e Computação

Ciclos de Estudo/Cursos

Sigla Nº de Estudantes Plano de Estudos Anos Curriculares Créditos UCN Créditos ECTS Horas de Contacto Horas Totais
M.EIC 164 Plano de estudos oficial 1 - 6 52 162

Docência - Responsabilidades

Docente Responsabilidade
Sérgio Sobral Nunes Regente

Docência - Horas

Teóricas: 2,00
Teórico-Práticas: 2,00
Tipo Docente Turmas Horas
Teóricas Totais 1 2,00
Sérgio Sobral Nunes 2,00
Teórico-Práticas Totais 8 16,00
Luis Miguel Salgado Nunes Vilaça 4,00
João Paulo Madureira Damas 2,00
Daniel Luís Gonçalves Garrido 4,00
Sara Filipa Couto Fernandes 4,00
Sérgio Sobral Nunes 2,00

Língua de trabalho

Inglês

Objetivos

A unidade curricular de PRI tem como objetivo preparar os estudantes para conhecer, compreender, desenhar e desenvolver soluções para o processamento e recuperação de informação.

Os objetivos específicos são:

  1. Sensibilizar os estudantes para os desafios associados à construção de sistemas de pesquisa de informação;
  2. Familiar os estudantes com os principais conceitos e técnicas associadas ao processamento e recuperação de informação;
  3. Capacitar os estudantes para desenhar, implementar e avaliar sistemas de pesquisa de informação sobre coleções de documentos.

Resultados de aprendizagem e competências

Ao completar esta unidade curricular, o estudante deve ser capaz de projetar e implementar um sistema para o processamento e recuperação de informação.

Em particular, o estudante deve ser capaz de:

  • Identificar e descrever as principais tarefas associadas ao processamento e recuperação de informação;
  • Descrever a arquitetura e funcionamento de um sistema de pesquisa de informação;
  • Descrever as tarefas associadas às fases de processamento de uma coleção (offline) e de processamento de interrogações (online);
  • Distinguir os diferentes modelos de recuperação de informação, identificando os seus princípios, os modelos para a representação de documentos, e as medidas de semelhança;
  • Descrever e implementar diferentes técnicas para a indexação de informação;
  • Descrever e implementar diferentes técnicas para a recuperação e ordenação de resultados;

Modo de trabalho

Presencial

Pré-requisitos (conhecimentos prévios) e co-requisitos (conhecimentos simultâneos)

Programação: conhecimento e prática com linguagens de programação para o desenvolvimento de aplicações.

Bases de Dados: conhecimento e prática de modelação de dados em UML.

Programa

A área do processamento e recuperação de informação

  • Recuperação de informação versus recuperação de dados;
  • O desenvolvimento da área da recuperação de informação;
  • Tarefas de recuperação de informação;
  • O processo de recuperação de informação.

Arquitetura dos sistemas de recuperação de informação

  • Componentes de um sistema de pesquisa;
  • Recolha de informação: seleção, aquisição e armazenamento;
  • Processamento de texto: análise lexical, extração de raízes, compressão;
  • Indexação: índices invertidos, construção e acesso;
  • Processamento das interrogações, interação, ordenação e avaliação dos resultados.

Modelos de recuperação

  • Modelo Booleano, modelo vetorial e modelo probabilístico;
  • Representação de documentos;
  • Medidas de semelhança.

Recuperação de informação na web

  • Análise de ligações;
  • Algoritmos HITS e PageRank.

Avaliação de sistemas de recuperação de informação

  • Coleções de teste, tópicos e avaliações de relevância;
  • Medidas para a avaliação de sistemas de pesquisa.

Bibliografia Obrigatória

Christopher D. Manning, Prabhakar Raghavan, Hinrich Schütze; Introduction to Information Retrieval, Cambridge University Press, 2008. ISBN: 0521865719
W. Bruce Croft; Search engines. ISBN: 978-0-13-136489-9

Bibliografia Complementar

Ricardo Baeza-Yates; Modern information retrieval. ISBN: 978-0321416919
Marti Hearst; Search User Interfaces, Cambridge University Press, 2009
Martin Kleppmann; Designing Data-Intensive Applications, O'Reilly, 2017. ISBN: 9781449373320

Métodos de ensino e atividades de aprendizagem

Os tópicos do programa são expostos numa série de sessões tutoriais (exposição teórica e trabalho laboratorial). Cada grupo de estudantes define e realiza um projeto ao longo do semestre, com parte do desenvolvimento, acompanhamento, e avaliação, realizadas em aula.

Projeto: desenho e implementação de um sistema de processamento e pesquisa de informação desenvolvido em grupos de estudantes. O projeto está organizado em entregas e apresentações parciais, que correspondem às fases de desenvolvimento do projeto.

O desenvolvimento do projeto será acompanhado durante as aulas teórico-práticas, e avaliado com base no acompanhamento, nos relatórios submetidos, e nas apresentações realizadas.

Os conceitos teóricos são avaliados através de um exame final, com perguntas de escolha múltipla e perguntas abertas.

Software

OpenRefine
Apache Lucene
Apache Solr
Docker

Palavras Chave

Ciências Físicas > Ciência de computadores > Informática

Tipo de avaliação

Avaliação distribuída com exame final

Componentes de Avaliação

Designação Peso (%)
Exame 40,00
Trabalho prático ou de projeto 60,00
Total: 100,00

Componentes de Ocupação

Designação Tempo (Horas)
Elaboração de projeto 70,00
Estudo autónomo 40,00
Frequência das aulas 52,00
Total: 162,00

Obtenção de frequência

As condições para obtenção de frequência são as seguintes:

  1. não exceder o número limite de faltas às aulas práticas (25% do número de aulas práticas do semestre);
  2. realizar a inscrição num grupo de trabalho dentro do período definido;
  3. participar em cada uma das fase de desenvolvimento do projeto;
  4. participar na apresentação e defesa final do projeto.

A participação no desenvolvimento do projeto (ponto 3) é aferida através das evidências produzidas pelo estudante (código e documentação), da avaliação dos docentes durante as aulas práticas, e da autoavaliação e heteroavaliação realizada no contexto do grupo.

Fórmula de cálculo da classificação final

A nota final será calculada usando a fórmula:

NF = 60% Projeto + 40% Exame

A obtenção de aprovação no projeto requer a participação, de cada estudante, em todas as fases do projeto, nomeadamente na seleção das fontes de dados, na seleção das tecnologias, na identificação e caraterização do problema, no desenho e implementação da solução, na escrita dos relatórios, e nas apresentações do projeto.

A classificação final individual do projeto pode variar de elemento para elemento do mesmo grupo, em mais ou menos 3 valores, com base na opinião dos docentes e na autoavaliação e heteroavaliação a realizar internamente em cada grupo.

A aprovação na unidade curricular está condicionada à obtenção de uma avaliação individual mínima de 40% no exame.

Avaliação especial (TE, DA, ...)

A avaliação distribuída, realizada durante o semestre de funcionamento da unidade curricular, é exigida a todos os estudantes, independentemente do regime de inscrição.

Os trabalhadores estudantes e equivalentes dispensados das aulas devem, com periodicidade a combinar com os docentes, apresentar a evolução dos seus trabalhos, assim como devem fazer a apresentação destes, simultaneamente com os estudantes ordinários, e realizar as provas teóricas de avaliação individual previstas.

Melhoria de classificação

Não é possível a melhoria da classificação obtida no projeto.

É possível a melhoria da classificação do exame, mantendo a classificação obtida no projeto na inscrição anterior.

Recomendar Página Voltar ao Topo
Copyright 1996-2024 © Faculdade de Engenharia da Universidade do Porto  I Termos e Condições  I Acessibilidade  I Índice A-Z  I Livro de Visitas
Página gerada em: 2024-10-19 às 09:26:27 | Política de Utilização Aceitável | Política de Proteção de Dados Pessoais | Denúncias