Código: | PRODEI034 | Sigla: | PLEI |
Áreas Científicas | |
---|---|
Classificação | Área Científica |
OFICIAL | Sistemas Inteligentes |
Ativa? | Sim |
Página Web: | https://moodle.up.pt/enrol/index.php?id=1578 |
Unidade Responsável: | Departamento de Engenharia Informática |
Curso/CE Responsável: | Programa Doutoral em Engenharia Informática |
Sigla | Nº de Estudantes | Plano de Estudos | Anos Curriculares | Créditos UCN | Créditos ECTS | Horas de Contacto | Horas Totais |
---|---|---|---|---|---|---|---|
PRODEI | 13 | Plano de estudos Oficial | 1 | - | 6 | 28 | 162 |
O objetivo principal desta unidade curricular é dotar os estudantes de conhecimentos sobre técnicas de processamento de linguagem natural e de extração de informação, articulando a apresentação dos fundamentos teóricos com aplicações práticas.
Ao completar a unidade curricular os estudantes deverão ser capazes de:
- Explicar os conceitos e técnicas fundamentais para o processamento e extração de informação;
- Demonstrar conhecimento da literatura relevante e capacidade de síntese e apresentação de trabalhos de investigação;
- Desenhar e implementar sistemas que efetuem a análise e extração automática de informação expressa em linguagem natural.
A unidade curricular funciona segundo um regime híbrido, que inclui uma componente teórica expositiva e uma componente de projeto. A componente teórica consistirá na exposição dos conceitos base sobre processamento de linguagem e extração de informação e na apresentação de literatura recente sobre a temática.
A componente de projeto permitirá aos estudantes aplicar esses conceitos em casos de estudo práticos. Os estudantes irão efetuar pesquisa, desenvolvimento e avaliação de uma solução de processamento de linguagem e extração de informação. No trabalho de investigação e desenvolvimento, os estudantes serão acompanhados em regime de tutoria.
A unidade curricular irá abordar os seguintes tópicos:
- Introdução ao processamento de linguagem natural: definições, tarefas e aplicações.
- Processamento básico de texto: expressões regulares, tokenização, normalização, lematização, stemming, segmentação.
- Modelos de linguagem: n-grams.
- Classificação de texto: bag-of-words, Naive Bayes, engenharia de features; classificadores generativos e discriminativos.
- Representações vectoriais de palavras: semântica lexical, embeddings de palavras.
- Modelos sequenciais: hidden Markov models, conditional random fields; marcação de classe gramatical e reconhecimento de entidades mencionadas.
- Redes neuronais em processamento de linguagem natural: modelos neuronais de linguagem, redes neuronais recorrentes, redes encoder-decoder, attention, redes transformer.
- Extração de informação: reconhecimento de entidades mencionadas e extração de relações, extração de eventos e tempos, preenchimento de templates.
- Investigação atual em processamento de linguagem natural e extração de informação.
Ensino presencial com aulas expositivas e acompanhamento individual dos trabalhos dos alunos.
Cada estudante define e realiza um projecto ao longo do semestre. Os temas dos projetos são propostos pelos estudantes e validados pelo docente.
A avaliação do projeto é feita com base em duas componentes:
1) SP: artigo curto – 30% da classificação final
2) FP: artigo longo – 70% da classificação final.
A componente SP será avaliada a meio do semestre e consistirá em:
- SP1: produção de um artigo curto (escrito em inglês) que descreva as primeiras investigações na resolução do problema que o estudante elegeu.
- SP2: apresentação curta (10 minutos) sobre o trabalho realizado até ao momento.
A componente FP será avaliada no final do semestre e consitirá em:
- FP1: produção de um artigo longo (escrito em inglês), contendo a descrição da solução final do problema, e os resultados das experiências de avaliação da solução proposta.
- FP2: apresentação pública (25 minutos) e demonstração do trabalho.
Designação | Peso (%) |
---|---|
Prova oral | 35,00 |
Trabalho escrito | 65,00 |
Total: | 100,00 |
Designação | Tempo (Horas) |
---|---|
Elaboração de projeto | 56,00 |
Estudo autónomo | 42,00 |
Frequência das aulas | 42,00 |
Total: | 140,00 |
Em todas as componentes de avaliação (SP1, SP2, FP1 e FP2) há uma nota mínima de 7 valores em 20. Para obterem frequência à unidade curricular, os estudantes deverão obter nota mínima nas 4 componentes.
A classificação final (CF) será calculada da seguinte forma:
CF = (20% * SP1 + 10% * SP2) + (45% * FP1 + 25% * FP2).
Componentes de avaliação:
- SP1: artigo curto
- SP2: apresentação curta (10 minutos)
- FP1: artigo longo
- FP2: apresentação pública (25 minutos) e demonstração do trabalho.
Os alunos sujeitos a regime de avaliação especial estão dispensados da componente presencial, excepto no momento das apresentações. Nestes casos, devem ser agendadas reuniões períodicas com o docente para acompanhamento dos trabalhos. A avaliação será realizada tendo em conta os parâmetros gerais definidos anteriormente.
Apenas a componente final da avaliação (70%) poderá ser melhorada. Para a obtenção de melhoria de classificação o estudante deverá submeter um novo trabalho final (i.e. artigo full-paper) e realizar a correspondente apresentação e demonstração.