Saltar para:
Logótipo
This page in english Ajuda Autenticar-se
Formação regular da Biblioteca |fevereiro a maio
Você está em: Início > PRODEI034
Autenticação




Mapa das Instalações
Edifício A (Administração) Edifício B (Aulas) - Bloco I Edifício B (Aulas) - Bloco II Edifício B (Aulas) - Bloco III Edifício B (Aulas) - Bloco IV Edifício C (Biblioteca) Edifício D (CICA) Edifício E (Química) Edifício F (Minas e Metalurgia) Edifício F (Minas e Metalurgia) Edifício G (Civil) Edifício H (Civil) Edifício I (Electrotecnia) Edifício J (Electrotecnia) Edifício K (Pavilhão FCNAUP) Edifício L (Mecânica) Edifício M (Mecânica) Edifício N (Garagem) Edifício O (Cafetaria) Edifício P (Cantina) Edifício Q (Central de Gases) Edifício R (Laboratório de Engenharia do Ambiente) Edifício S (INESC) Edifício T (Torre do INEGI) Edifício U (Nave do INEGI) Edifício X (Associação de Estudantes)

Processamento de Linguagem e Extração de Informação

Código: PRODEI034     Sigla: PLEI

Áreas Científicas
Classificação Área Científica
OFICIAL Sistemas Inteligentes

Ocorrência: 2018/2019 - 1S Ícone do Moodle

Ativa? Sim
Página Web: http://www.fe.up.pt/~ssn/2015/plei/
Unidade Responsável: Departamento de Engenharia Informática
Curso/CE Responsável: Programa Doutoral em Engenharia Informática

Ciclos de Estudo/Cursos

Sigla Nº de Estudantes Plano de Estudos Anos Curriculares Créditos UCN Créditos ECTS Horas de Contacto Horas Totais
PRODEI 5 Plano de estudos Oficial 1 - 6 28 162

Docência - Horas

Teórico-Práticas: 2,00
Tipo Docente Turmas Horas
Teórico-Práticas Totais 1 2,00
Carlos Manuel Milheiro de Oliveira Pinto Soares 2,00

Língua de trabalho

Português - Suitable for English-speaking students

Objetivos

O objetivo principal desta unidade curricular é dotar os estudantes de conhecimentos sobre técnicas de processamento de linguagem natural e de extração de informação, articulando a apresentação dos fundamentos teóricos com aplicações práticas.

Resultados de aprendizagem e competências

Ao completar a unidade curricular os estudantes deverão ser capazes de:

- Explicar os conceitos e técnicas fundamentais para o processamento e extração de informação;
- Demonstrar conhecimento da literatura relevante e capacidade de síntese e apresentação de trabalhos de investigação;
- Desenhar e implementar sistemas que efetuem a análise e extração automática de informação expressa em linguagem natural.

Modo de trabalho

Presencial

Programa

A unidade curricular funciona segundo um regime híbrido, que inclui uma componente teórica expositiva e uma componente de projeto. A componente teórica consistirá na exposição dos conceitos base sobre processamento de linguagem e extração de informação e na apresentação de literatura recente sobre a temática.

A componente de projeto permitirá aos estudantes aplicar esses conceitos em casos de estudo práticos. Os estudantes irão efetuar pesquisa, desenvolvimento e avaliação de uma solução de processamento de linguagem e extração de informação. No trabalho de pesquisa e desenvolvimento, os estudantes serão acompanhados em regime de tutoria.

A unidade curricular irá abordar os seguintes tópicos:
- Introdução aos conceitos associados ao processamento de linguagem natural.
- Apresentação de técnicas e aplicações típicas de processamento de linguagem e extração de informação: reconhecimento de entidades mencionadas, co-referências , POS tagging, sumarização automática, análise de sentimento, desambiguação de sentido, etc.
- Introdução a técnicas de aprendizagem automática para classificação de texto e extração de tópicos (e.g. SVM, Latent Dirichlet Allocation). Representação de documentos: bag-of-words, n-grams.
- Processamento de conteúdos gerados por utilizadores e extração de informação em redes sociais (e.g., blogs, micro-blogs, etc.): folksonomias; identificação de tópicos; sumarização; recomendação de conteúdos.
- Extração de relações semânticas e desambiguação de entidades mencionadas utilizando recursos externos ao corpus (e.g., Wikipedia, Wordnet).
- Análise de logs, deteção de padrões e geração de recomendações.

Bibliografia Obrigatória

Christopher D. Manning, Hinrich Schutze; Foundations of statistical natural language processing. ISBN: 0-262-13360-1

Bibliografia Complementar

Christopher D. Manning, Prabhakar Raghavan, Hinrich Schutze; Introduction to information retrieval. ISBN: 978-0-521-86571-5 (Conteúdo integral disponível em http://nlp.stanford.edu/IR-book/)
Steven Bird, Ewan Klein, Edward Loper; Natural Language Processing with Python, O'Reilly Media, 2009. ISBN: 978-0-596-51649-9 (Conteúdo integral disponível em http://www.nltk.org/book/)

Métodos de ensino e atividades de aprendizagem

Ensino presencial com aulas expositivas e acompanhamento individual dos trabalhos dos alunos.

Cada estudante define e realiza um projecto ao longo do semestre. Os temas dos projetos são propostos pelos estudantes e validados pelo docente.

A avaliação do projeto é feita com base em duas componentes:
1) SP: artigo curto – 30% da classificação final
2) FP: artigo longo – 70% da classificação final.

A componente SP será avaliada a meio do semestre e consistirá na: SP1: produção de um artigo curto (escrito em inglês) que descreva as primeiras investigações na resolução do problema que o estudante elegeu. SP2: apresentação curta (10 minutos) sobre o trabalho realizado até ao momento.

A componente FP será avaliada no final do semestre e consitirá na: FP1: produção de um artigo longo (escrito em inglês), contendo a descrição da solução final do problema, e os resultados das experiências de avaliação da solução proposta. FP2: apresentação pública (25 minutos) e demonstração do trabalho.

Palavras Chave

Ciências Tecnológicas > Engenharia > Engenharia de computadores

Tipo de avaliação

Avaliação distribuída sem exame final

Componentes de Avaliação

Designação Peso (%)
Prova oral 35,00
Trabalho escrito 65,00
Total: 100,00

Componentes de Ocupação

Designação Tempo (Horas)
Elaboração de projeto 56,00
Estudo autónomo 42,00
Frequência das aulas 42,00
Total: 140,00

Obtenção de frequência

Em todas as componentes de avaliação (SP1, SP2, FP1 e FP2) há uma nota mínima de 7 valores em 20. Para obterem frequência à unidade curricular, os estudantes deverão obter nota mínima nas 4 componentes.

Fórmula de cálculo da classificação final

A classificação final (CF) será calculada da seguinte forma:

CF = (20% * SP1 + 10% * SP2) + (45% * FP1 + 25% * FP2).

Componentes de avaliação:
- SP1: artigo curto
- SP2: apresentação curta (10 minutos)
- FP1: artigo longo
- FP2: apresentação pública (25 minutos) e demonstração do trabalho.

Avaliação especial (TE, DA, ...)

Os alunos sujeitos a regime de avaliação especial estão dispensados da componente presencial, excepto no momento das apresentações. Nestes casos, devem ser agendadas reuniões períodicas com o docente para acompanhamento dos trabalhos. A avaliação será realizada tendo em conta os parâmetros gerais definidos anteriormente.

Melhoria de classificação

Apenas a componente final da avaliação (70%) poderá ser melhorada. Para a obtenção de melhoria de classificação o estudante deverá submeter um novo trabalho final (i.e. artigo full-paper) e realizar a correspondente apresentação e demonstração.

Recomendar Página Voltar ao Topo
Copyright 1996-2019 © Faculdade de Engenharia da Universidade do Porto  I Termos e Condições  I Acessibilidade  I Índice A-Z  I Livro de Visitas
Página gerada em: 2019-04-23 às 23:47:10 | Política de Utilização Aceitável | Política de Proteção de Dados Pessoais