Saltar para:
Logótipo
This page in english Ajuda Autenticar-se
PNL
Você está em: Início > PRODEI034

Processamento de Linguagem e Extração de Informação

Código: PRODEI034     Sigla: PLEI

Áreas Científicas
Classificação Área Científica
OFICIAL Sistemas Inteligentes

Ocorrência: 2013/2014 - 1S (de 09-09-2013 a 20-12-2013) Ícone do Moodle

Ativa? Sim
Página Web: http://www.fe.up.pt/~ssn/2013/plei/
Unidade Responsável: Departamento de Engenharia Informática
Curso/CE Responsável: Programa Doutoral em Engenharia Informática

Ciclos de Estudo/Cursos

Sigla Nº de Estudantes Plano de Estudos Anos Curriculares Créditos UCN Créditos ECTS Horas de Contacto Horas Totais
PRODEI 1 Plano de estudos Oficial 1 - 6 54 162

Docência - Horas

Teórico-Práticas: 3,00
Tipo Docente Turmas Horas
Teórico-Práticas Totais 1 3,00
Sérgio Sobral Nunes 3,00

Língua de trabalho

Português - Suitable for English-speaking students

Objetivos

O objetivo principal desta unidade curricular é dotar os estudantes de conhecimentos base sobre técnicas de processamento de linguagem natural e de extração de informação, bem como apresentar um conjunto de cenários reais de aplicação dessas técnicas, que demonstrem como processar grandes quantidades de informação, disponíveis em diferentes tipos de repositórios, tais como notícias, artigos científicos, blogs, redes sociais, etc.

Resultados de aprendizagem e competências

Ao completar a unidade curricular os estudantes deverão ser capazes de:

- Explicar os conceitos e técnicas fundamentais para o processamento e extração de informação;
- Demonstrar conhecimento da literatura relevante e capacidade de síntese e apresentação de trabalhos de investigação;
- Desenhar e implementar sistemas que efetuem a análise e extração automática de informação expressa em linguagem natural.

Modo de trabalho

Presencial

Programa

A unidade curricular funciona segundo um regime híbrido, que inclui uma componente teórica expositiva e uma componente de projeto. A componente teórica consistirá na exposição dos conceitos base sobre processamento de linguagem e extração de informação e na apresentação de literatura recente sobre a temática.

A componente de projeto permitirá aos estudantes aplicar esses conceitos em casos de estudo práticos. Os estudantes irão efetuar pesquisa, desenvolvimento e avaliação de uma solução de processamento de linguagem e extração de informação. No trabalho de pesquisa e desenvolvimento, os estudantes serão acompanhados em regime de tutoria.

A unidade curricular irá abordar os seguintes tópicos:
- Introdução aos conceitos associados ao processamento de linguagem natural.
- Apresentação de técnicas e aplicações típicas de processamento de linguagem e extração de informação: reconhecimento de entidades mencionadas, co-referências , POS tagging, sumarização automática, análise de sentimento, desambiguação de sentido, etc.
- Introdução a técnicas de aprendizagem automática para classificação de texto e extração de tópicos (e.g. SVM, Latent Dirichlet Allocation). Representação de documentos: bag-of-words, n-grams.
- Processamento de conteúdos gerados por utilizadores e extração de informação em redes sociais (e.g., blogs, micro-blogs, etc.): folksonomias; identificação de tópicos; sumarização; recomendação de conteúdos.
- Extração de relações semânticas e desambiguação de entidades mencionadas utilizando recursos externos ao corpus (e.g., Wikipedia, Wordnet).
- Análise de logs, deteção de padrões e geração de recomendações.

Bibliografia Obrigatória

Christopher D. Manning, Hinrich Schutze; Foundations of statistical natural language processing. ISBN: 0-262-13360-1

Bibliografia Complementar

Christopher D. Manning, Prabhakar Raghavan, Hinrich Schutze; Introduction to information retrieval. ISBN: 978-0-521-86571-5 (Conteúdo integral disponível em http://nlp.stanford.edu/IR-book/)

Métodos de ensino e atividades de aprendizagem

Ensino presencial com aulas expositivas e acompanhamento individual dos trabalhos dos alunos.

Cada estudante define e realiza um projecto ao longo do semestre. Os temas dos projetos são propostos pelos estudantes e validados pelo docente.

A avaliação do projeto é feita com base em duas componentes:
1) SP: artigo curto – 30% da classificação final
2) FP: artigo longo – 70% da classificação final.

A componente SP será avaliada a meio do semestre e consistirá na: SP1: produção de um artigo curto (escrito em inglês) que descreva as primeiras investigações na resolução do problema que o estudante elegeu. SP2: apresentação curta (10 minutos) sobre o trabalho realizado até ao momento.

A componente FP será avaliada no final do semestre e consitirá na: FP1: produção de um artigo longo (escrito em inglês), contendo a descrição da solução final do problema, e os resultados das experiências de avaliação da solução proposta. FP2: apresentação pública (25 minutos) e demonstração do trabalho.

Palavras Chave

Ciências Tecnológicas > Engenharia > Engenharia de computadores

Tipo de avaliação

Avaliação distribuída sem exame final

Componentes de Avaliação

Designação Peso (%)
Participação presencial 20,00
Trabalho de campo 40,00
Trabalho escrito 20,00
Trabalho laboratorial 20,00
Total: 100,00

Componentes de Ocupação

Designação Tempo (Horas)
Elaboração de projeto 56,00
Estudo autónomo 42,00
Frequência das aulas 42,00
Total: 140,00

Obtenção de frequência

Em todas as componentes de avaliação (SP1, SP2, FP1 e FP2) há uma nota mínima de 7 valores em 20. Para obterem frequência à unidade curricular, os estudantes deverão obter nota mínima nas 4 componentes.

Fórmula de cálculo da classificação final

A classificação final (CF) será calculada da seguinte forma:

CF = (20% * SP1 + 10% * SP2) + (45% * FP1 + 25% * FP2).

Componentes de avaliação:
- SP1: artigo curto
- SP2: apresentação curta (10 minutos)
- FP1: artigo longo
- FP2: apresentação pública (25 minutos) e demonstração do trabalho.

Avaliação especial (TE, DA, ...)

Os alunos sujeitos a regime de avaliação especial estão dispensados da componente presencial, excepto no momento das apresentações. Nestes casos, devem ser agendadas reuniões períodicas com o docente para acompanhamento dos trabalhos. A avaliação será realizada tendo em conta os parâmetros gerais definidos anteriormente.

Melhoria de classificação

Apenas a componente final da avaliação (70%) poderá ser melhorada. Para a obtenção de melhoria de classificação o estudante deverá re-submeter um novo trabalho final (i.e. artigo full-paper) e realizar a correspondente apresentação e demonstração.

Recomendar Página Voltar ao Topo
Copyright 1996-2021 © Faculdade de Engenharia da Universidade do Porto  I Termos e Condições  I Acessibilidade  I Índice A-Z  I Livro de Visitas
Página gerada em: 2021-04-13 às 04:31:22 | Política de Utilização Aceitável | Política de Proteção de Dados Pessoais