Resumo: |
A manipulação de grandes quantidades de informação, até recentemente uma tarefa de especialistas, é agora uma necessidade para pessoas de todas as áreas, tanto na sua actividade profissional como na maioria das tarefas do dia a dia.
A qualidade na recuperação de informação é crucial em muitas profissões, e a melhoria dos sistemas pode ter um grande impacto nesta, especialmente quando se trata de colecções de documentos heterogéneos.
A pesquisa na Web tem sido um excelente campo para a recuperação de informação em grande escala e a indexação automática maciça. Motores de pesquisa do estado da arte exibem bom desempenho na recuperação de documentos textuais.
A noção de documento está entretanto a mudar, com objectos multimédia a serem criados por muitas aplicações comuns; a informação audiovisual precisa de ser gerida tanto nos grandes criadores de conteúdos como nos arquivos domésticos.
Os sistemas de recuperação actuais dependem das palavras das interrogação para obter os documentos relevantes. Sendo as colecções de documentos indexadas com base no conteúdo textual, os documentos sem texto tornam-se invisíveis. Para melhorar é preciso indexar o conteúdo visual e áudio e usar formas mais elaboradas de extracção do significado. O resultado de uma interrogação acerca de "actividades desportivas universitárias" deveria incluir tanto o vídeo de um torneio universitário como um artigo de investigação sobre o impacto do desporto no sucesso dos estudantes. O sistema de recuperação deve ser capaz de processar documentos e criar descrições que relacionem esses objectos, usando palavras, ontologias subjacentes e a análise de audiovisual.
Avançar para além da recuperação de texto requer a análise de segmentos de áudio e vídeo. O protótipo Metamedia (FEUP) incorpora já a extracção destas características e a associação automática dos descritores correspondentes ao documento. Mais trabalho é necessário nesta área para criar descritores mais expressivos. As ontologias serão |
Resumo A manipulação de grandes quantidades de informação, até recentemente uma tarefa de especialistas, é agora uma necessidade para pessoas de todas as áreas, tanto na sua actividade profissional como na maioria das tarefas do dia a dia.
A qualidade na recuperação de informação é crucial em muitas profissões, e a melhoria dos sistemas pode ter um grande impacto nesta, especialmente quando se trata de colecções de documentos heterogéneos.
A pesquisa na Web tem sido um excelente campo para a recuperação de informação em grande escala e a indexação automática maciça. Motores de pesquisa do estado da arte exibem bom desempenho na recuperação de documentos textuais.
A noção de documento está entretanto a mudar, com objectos multimédia a serem criados por muitas aplicações comuns; a informação audiovisual precisa de ser gerida tanto nos grandes criadores de conteúdos como nos arquivos domésticos.
Os sistemas de recuperação actuais dependem das palavras das interrogação para obter os documentos relevantes. Sendo as colecções de documentos indexadas com base no conteúdo textual, os documentos sem texto tornam-se invisíveis. Para melhorar é preciso indexar o conteúdo visual e áudio e usar formas mais elaboradas de extracção do significado. O resultado de uma interrogação acerca de "actividades desportivas universitárias" deveria incluir tanto o vídeo de um torneio universitário como um artigo de investigação sobre o impacto do desporto no sucesso dos estudantes. O sistema de recuperação deve ser capaz de processar documentos e criar descrições que relacionem esses objectos, usando palavras, ontologias subjacentes e a análise de audiovisual.
Avançar para além da recuperação de texto requer a análise de segmentos de áudio e vídeo. O protótipo Metamedia (FEUP) incorpora já a extracção destas características e a associação automática dos descritores correspondentes ao documento. Mais trabalho é necessário nesta área para criar descritores mais expressivos. As ontologias serão usadas, explorando tanto a inclusão aí de descritores audiovisuais como a combinação destes com ontologias do domínio.
Uma segunda componente é a gestão de diálogos. A tarefa de recuperação pode ser melhorada recolhendo informação da interacção com o utilizador e analisando o diálogo entre este e o sistema para inferir intenções e planos. Sendo a recuperação
uma tarefa intrinsecamente imprecisa, este trabalho tem de ser complementado com procedimentos e ferramentas de avaliação adequados.
Uma terceira linha de investigação lida com o refinamento do modelo de base de dados para aí incluir a associação de meta-informação a objectos a diversos níveis, a conformidade com normas do audiovisual e o uso de descritores heterogéneos na computação de similaridade para a recuperação. Os descritores audiovisuais são frequentemente multi-dimensionais e quantitativos, sendo a escolha de medidas de similaridade um campo fértil para novas abordagens. |