Descrição, Armazenamento e Pesquisa de Informação
Áreas Científicas |
Classificação |
Área Científica |
OFICIAL |
Sistemas de Informação |
Ocorrência: 2017/2018 - 1S
Ciclos de Estudo/Cursos
Língua de trabalho
Inglês
Objetivos
ENQUADRAMENTO
A unidade curricular "Descrição, Armazenamento e Pesquisa de Informação" tem como contexto a existência de grandes repositórios de informação de natureza muito diversa e os requisitos para a sua organização, descrição, armazenamento e pesquisa.
OBJETIVOS ESPECÍFICOS
- Sensibilizar os estudantes para os problemas do armazenamento e organização de grandes coleções de dados.
- Familiarizar os estudantes com os conceitos principais na pesquisa de documentos textuais e da sua aplicação em ferramentas.
- Explorar os métodos e ferramentas para a descrição de recursos na web e para o uso da descrição em aplicações que fazem uso do significado dos dados.
Resultados de aprendizagem e competências
No final desta unidade curricular o estudante deverá ser capaz de:
- Identificar fontes de dados em repositórios de dados, APIs de serviços on-line e registos (logs) de utilizadores;
- Decidir sobre a qualidade das fontes de dados e caracterizar um conjunto de dados selecionado;
- Escolher a granularidade do documento e um modelo de armazenamento para o conjunto de dados;
- Usar as ferramentas de manipulação de dados para selecionar subconjuntos de dados apropriados e para ajustar os dados às suas aplicações pretendidas;
- Descrever os modelos usados na recuperação de informação, e em particular na recuperação na web;
- Reconhecer as diversas tarefas que são consideradas na recuperação de informação;
- Aplicar as medidas de avaliação da recuperação de informação à comparação de ferramentas de pesquisa na web;
- Relacionar os documentos na web com a meta-informação que os descreve e relaciona;
- Tratar as ontologias como fornecedoras de ferramentas de descrição;
- Explorar as aplicações que manipulam descrições de informação na web semântica e criar conjuntos de metadados para um domínio;
- Comparar serviços baseados na web semântica e outras abordagens mais simples para a descrição de recursos.
Modo de trabalho
Presencial
Pré-requisitos (conhecimentos prévios) e co-requisitos (conhecimentos simultâneos)
Conhecimento e prática com linguagens de programação para o desenvolvimento de aplicações.
Programa
- Introdução às coleções de dados; ferramentas para recolha, preparação e acesso a dados; modelos de dados e armazenamento de coleções.
- Pesquisa de informação de base textual; modelos de recuperação; avaliação; recuperação de informação na web.
- Descrição de informação: linguagens da Web semântica; RDF, RDF-Schema, OWL; ontologias para dados de um domínio.
Bibliografia Obrigatória
Christopher D. Manning, Prabhakar Raghavan, Hinrich Schütze;
Introduction to Information Retrieval, Cambridge University Press, 2008. ISBN: 0521865719
Anders Møller, Michael I. Schwartzbach;
An Introduction to XML and Web Technologies, Addison Wesley Professional, 2006. ISBN: 0321269667
Métodos de ensino e atividades de aprendizagem
Os tempos letivos são usadas para exposição de matéria teórica, com referência à bibliografia relevante, desenvolvimento de exemplos relacionados, discussão de leituras propostas e resolução pelos estudantes de exercícios propostos.
Software
Apache Lucene
Apache Solr
Protégé
Palavras Chave
Ciências Físicas > Ciência de computadores > Informática
Tipo de avaliação
Avaliação distribuída sem exame final
Componentes de Avaliação
Designação |
Peso (%) |
Teste |
40,00 |
Trabalho escrito |
60,00 |
Total: |
100,00 |
Componentes de Ocupação
Designação |
Tempo (Horas) |
Elaboração de projeto |
81,00 |
Estudo autónomo |
48,00 |
Frequência das aulas |
33,00 |
Total: |
162,00 |
Obtenção de frequência
A unidade curricular tem uma componente de avaliação prática que é o resultado da realização dos trabalhos, a entregar antes das respetivas datas limite fixadas no plano da unidade curricular.
Os estudantes têm de obter 50% em cada um dos elementos da avaliação prática.
A aprovação na unidade curricular está condicionada à obtenção de classificação superior a 40% em cada um dos mini-testes.
Fórmula de cálculo da classificação final
A classificação final é calculada usando a fórmula: NOTA = 60% Trabalho + 40% Mini-testes.
A componente Trabalho é o resultado da avaliação prática e pode ser obtida:
- realizando três trabalhos de acordo com os guiões propostos;
- propondo um projeto para o semestre e realizando entregas e apresentações de resultados nos mesmos prazos que os dos trabalhos.
A opção pelo projeto e o seu plano de trabalho têm de ser acordados com os docentes.
Provas e trabalhos especiais
Não há provas nem trabalhos especiais.
Avaliação especial (TE, DA, ...)
A avaliação distribuída, realizada durante o semestre de funcionamento da unidade curricular, é exigida a todos os estudantes, independentemente do regime de inscrição.
Melhoria de classificação
A classificação pode ser melhorada na edição seguinte da unidade curricular.