Reconhecimento Visual
Áreas Científicas |
Classificação |
Área Científica |
CNAEF |
Ciências informáticas |
Ocorrência: 2022/2023 - 2S
Ciclos de Estudo/Cursos
Sigla |
Nº de Estudantes |
Plano de Estudos |
Anos Curriculares |
Créditos UCN |
Créditos ECTS |
Horas de Contacto |
Horas Totais |
MVCOMP |
3 |
Plano de Estudos Oficial |
1 |
- |
6 |
42 |
162 |
Língua de trabalho
Inglês
Objetivos
As tarefas de reconhecimento visual vão desde a deteção de objetos em imagens e vídeos, classificação de objetos e reconhecimento de instâncias até ao reconhecimento de ações humanas. Neste curso faremos um estudo das primeiras tarefas de reconhecimento visual, visto que o reconhecimento de ações é o tema principal da unidade curricular Reconhecimento da Ação Humana.
O objetivo é que os alunos adquiram conhecimentos e competências que lhes permitam projetar sistemas de deteção de movimento por vídeo, segmentação e rastreio baseado em movimento, classificação e deteção de objetos em imagens e vídeo, bem como rastreio visual de objetos.
Resultados de aprendizagem e competências
Atenção especial será dada às competências específicas (CE) listadas abaixo e, em diferente grau, de acordo com as características da disciplina, as seguintes competências escolhidas entre as competências de níveis gerais (GC), transversais (CT) e de formação básica (CB):
Fundamentos:
CB8: Espera-se que os estudnates sejam capazes de integrar conhecimentos e enfrentar a complexidade de fazer julgamentos com base em informações que, sendo incompletas ou limitadas, incluem reflexões sobre responsabilidades sociais e éticas vinculadas à aplicação de seus conhecimentos e julgamentos.
CB10: Espera-se que os estudantes adquiram as competências de aprendizagem que lhes permitem continuar estudando de uma forma que será em grande parte autodirigida ou autónoma.
Transversal:
CT3: Desenvolvimento do espírito inovador e empreendedor.
Em geral:
CG1: Capacidade de analisar e sintetizar conhecimento.
CG7: Capacidade de aprender de forma independente para se especializar em uma ou mais áreas de estudo.
Específico:
CE1: Espera-se que os estudantes conheçam e apliquem os conceitos, metodologias e tecnologias de processamento de imagem.
CE2: Espera-se que os estudantes conheçam e apliquem técnicas de aprendizagem máquina e reconhecimento de padrões aplicadas à visão computacional.
CE3: Espera-se que os estudanets conheçam e apliquem os conceitos, metodologias e tecnologias de análise de imagem e vídeo.
CE5: Espera-se que os estudantes saibam como analisar e aplicar métodos do estado-da-arte em visão computacional.
CE9: Espera-se que os estudantes conheçam e apliquem os conceitos, metodologias e tecnologias para o reconhecimento de padrões visuais em cenas reais.
Modo de trabalho
B-learning
Programa
* PARTE 1 UPorto:
-------------------------
1-Introdução à análise de vídeo.
Percepção de movimento
Imagens multidimensionais e sequências de imagens
Amostragem espaço-temporal de imagem
Desfoque de movimento e filtragem espaço-temporal
2-Deteção e estimação de movimento
Alinhamento e registo de imagem
Estimação de movimento densa e hierárquica
Pirâmides de imagens discretas multiresolução
Cálculo de fluxo óptico: baseado em intensidade, energia e fase
3-Segmentação e rastreio de movimento
Movimento paramétrico, movimento baseado em splines, movimento em camadas
Rastreio de movimento tradicional: filtros Kalman, filtros de partículas
* PARTE 2 USC:
-------------
4-Extração e correspondência de características invariantes
Descritores binários locais
Descritores Espetrais
Descritores de espaço de base
Métodos de codificação esparsa
5-Métodos clássicos de classificação de imagens e deteção de objetos
Métodos Geométricos
Métodos baseados em aparência
Abordagens baseadas em características
Abordagens de janela deslizante
Sacos de palavras visuais
Modelos baseados em partes
6-Métodos de deteção e rastreio de objetos baseados em aprendizagem máquina profunda
Redes Neurais Convolucionais para deteção de objetos em imagens.
Redes Neurais Convolucionais para deteção de objetos em vídeos.
Abordagens de aprendizagem profunda para rastreio visual.
O programa inclui os principais tópicos de interesse atual em reconhecimento visual e que são transversais a vários domínios de aplicação.
Bibliografia Obrigatória
Richard Szeliski;
Computer vision. ISBN: 978-1-84882-935-0
Bibliografia Complementar
Atiqur Rahman Ahad;
Computer vision and action recognition. ISBN: 978-94-91216-20-6
Boguslaw Cyganek;
Object Detection and Recognition in Digital Images: Theory and Practice, John Wiley & Sons, Ltd, 2013. ISBN: 978-1-118-61836-3
Métodos de ensino e atividades de aprendizagem
O desenvolvimento das aulas será efetuado harmonizando as metodologias de ensino com os objetivos fundamentais da disciplina. Esta será uma disciplina com exposição e aplicações, onde os estudantes aprenderão não só o porquê, mas também como implementar, avaliar e decidir sobre sistemas de reconhecimento visual.
A disponibilização das informações e conhecimentos científicos previstos nos objetivos será desenvolvida no início de cada tema a abordar, onde será estabelecida a relação com outros tópicos já tratados em aulas anteriores ou noutra disciplina. Estas sessões terão como objetivo desenvolver as competências dos estudantes e sensibilizá-los para a importância das temáticas abordadas no contexto real atual, contribuindo para um melhor enquadramento e também para uma melhor perceção dos objetivos que se pretende atingir.
Atendendo ao caráter prático dos temas a tratar, serão apresentados e propostos vários exercícios e casos práticos, resultantes de trabalhos de investigação desenvolvidos. Os estudantes aprenderão fazendo, refletindo e tomando decisões sobre os problemas e alternativas propostas, aprimorando suas competências nos tópicos em análise. Tentará estimular-se um processo de diálogo no qual todos participem, por meio de sua própria experiência e conhecimento. Assim, conhecimentos, dúvidas e questões serão compartilhados, de forma a beneficiar a aprendizagem dos estudamtes e motivá-los a se motivarem. No essencial, serão envidados esforços para assegurar o desenvolvimento das capacidades de “aplicar em diferentes contextos” os conhecimentos adquiridos sob a influência de diferentes fatores e variáveis.
Os trabalhos práticos de grupo terão um importante contributo para a concretização dos objetivos definidos para a disciplina, proporcionando a compreensão e aplicação dos temas em estudo, bem como evidenciando os benefícios dos projetos de visão computacional na eficiência das empresas. Tal permitirá identificar os diferentes recursos e componentes de um projeto, as suas relações internas e externas, bem como utilizar de forma geral e integrada os conceitos e metodologias abordadas ao longo desta e outras unidades curriculares.
A realização do trabalho prático terá também as vantagens de compartilhar conhecimentos entre os membros do grupo, em busca de informações externas e, portanto, do contato com a realidade. A sua posterior apresentação e defesa, bem como a análise de um projeto realizado por outro grupo da turma, contribuirão de forma decisiva para o reforço da capacidade de análise considerada essencial para a concretização dos objetivos desta disciplina.
As competências CE1, CE2, CE3 e CE5 possuem conteúdos teóricos e práticos específicos associados à disciplina e serão avaliados explicitamente ao longo do curso.
O trabalho das competências CG1, CG7, CB8 e CB10 são trabalhados principalmente através da análise e discussão em grupo de artigos do estado da arte.
As competências CT3 são especialmente trabalhadas em projetos em grupo.
A avaliação dos alunos servirá para aferir a eficácia das metodologias de ensino desenvolvidas de acordo com os objetivos da disciplina.
Veja Plano de Contingência para Cenários Alternativos (Distanciamento, Fecho de Instalações).
Palavras Chave
Ciências Físicas > Ciência de computadores
Ciências Físicas > Ciência de computadores > Sistema de computadores > Interacção pessoa-computador
Ciências Físicas > Ciência de computadores > Cibernética > Inteligência artificial
Ciências Tecnológicas > Tecnologia > Tecnologia de computadores > Processamento de imagem
Tipo de avaliação
Avaliação distribuída com exame final
Componentes de Avaliação
Designação |
Peso (%) |
Apresentação/discussão de um trabalho científico |
10,00 |
Exame |
60,00 |
Trabalho escrito |
10,00 |
Trabalho laboratorial |
10,00 |
Trabalho prático ou de projeto |
10,00 |
Total: |
100,00 |
Componentes de Ocupação
Designação |
Tempo (Horas) |
Apresentação/discussão de um trabalho científico |
10,00 |
Elaboração de projeto |
30,00 |
Estudo autónomo |
30,00 |
Frequência das aulas |
42,00 |
Trabalho escrito |
20,00 |
Trabalho laboratorial |
30,00 |
Total: |
162,00 |
Obtenção de frequência
O estudante deve comparecer à maioria das aulas de acordo com o regulamento da universidade e concluir com sucesso os trabalhos propostos durante o curso.
Fórmula de cálculo da classificação final
A avaliação da disciplina é composta por três partes:
Parte A
60%: A parte relativa à apresentação das sessões será avaliada através de um teste escrito final com questões teóricas e problemas práticos. Alternativamente, esta parte pode ser realizada através da avaliação contínua das práticas laboratoriais, que avaliarão a adequação das soluções propostas aos problemas, a qualidade dos resultados obtidos e a compreensão das técnicas utilizadas.
É usado para avaliar as competências CE1, CE2, CE3 e CE3 principalmente.
Parte B
30%: Resolução de casos práticos (projeto de investigação). Será avaliada a adequação das soluções propostas para os problemas, a qualidade dos resultados obtidos e a compreensão das técnicas utilizadas.
É utilizado para avaliar o CT3, além das competências específicas.
Parte C
10%: Análise de estado da arte de artigo em reconhecimento visual.
É usado para avaliar principalmente as competências CG1, CG7, CB8 e CB10.
O resultado final (RF) será obtido pela fórmula: RF = 0,6 A + 0,3 B + 0,1 C
Nos casos de execução fraudulenta de exercícios ou provas, aplicar-se-á o disposto no Regulamento de avaliação do rendimento escolar dos alunos e de revisão de habilitações.
Em aplicação do Regulamento do ETSE sobre plágio (aprovado pelo Conselho do ETSE em 19/12/2019) a cópia total ou parcial de qualquer exercício de prática ou teoria irá supor uma falha em ambas as oportunidades do curso, com a classificação de 0.0 em ambos os casos.
Veja Plano de Contingência para Cenários Alternativos (Distanciamento, Fechamento de Instalações).
Provas e trabalhos especiais
Não Aplicável
Trabalho de estágio/projeto
Não Aplicável
Avaliação especial (TE, DA, ...)
Não Aplicável
Melhoria de classificação
O estudante poderá fazer um exame de recurso e/ou resubmeter os trabalhos nos períodos adequados para melhorar a nota em qualquer uma das partes da avaliação.
Observações
O campus virtual da UPorto e da USC será utilizado para cada uma das partes.
A disciplina será ministrada em inglês.
Plano de contingência:
Caso a situação de saúde aconselhe o estabelecimento de um Cenário 2 (distanciamento):
1) todas as aulas expositivas serão ministradas online (de forma síncrona pelo Microsoft Teams ou de forma assíncrona através da publicação de vídeos gravados pelo corpo docente),
2) aulas interativas serão ministradas presencialmente em sala de informática,
3) o peso das diferentes partes do programa e os requisitos para realizá-lo permanecerão inalterados,
4) O teste final será feito presencialmente.
No caso de a situação de saúde aconselhar o estabelecimento de um Cenário 3 (fecho de instalações):
1) todas as aulas expositivas serão ministradas online (de forma síncrona pelo Microsoft Teams ou de forma assíncrona através da publicação de vídeos gravados pelo corpo docente),
2) todas as aulas interativas serão ministradas online (de forma síncrona pelo Microsoft Teams ou de forma assíncrona por meio da publicação de vídeos gravados pelos professores),
3) o peso das diferentes partes do programa e os requisitos para realizá-lo permanecerão inalterados,
4) O teste final será feito presencialmente, utilizando o Microsoft Teams e as ferramentas da sala de aula virtual Moodle.