Resumo: |
O principal objectivo do projecto é o desenvolvimento de uma interface Web que permita aos investigadores uilizarem uma ferramenta de análise automática de dados baseada em Indução de Programas em Lógica (Inductive Logic Programming -- ILP). Um investigador pode, neste sítio Web, realizar uma série de análises sofisticadas dos seus dados sem precisar de ter qualquer conhecimento sobre ILP.
Os utilizadores alvo são, neste projecto, investigadores da área das Ciências da Vida familiarizados com alguns serviços Web disponibilizados por universidades em todo o mundo e que permitem análises de dados de Genómica, Proteómica, etc como por exemplo o programa Fasta. A interface é suficientemente genérica para poder ser usada em problemas fora das Ciências da Vida.
Estamos certos que o projecto permitirá aos investigadores alargarem a análise dos seus dados pelo facto de poderem usar com facilidade uma ferramenta poderosa e de modo fácil.
Para alcançar os objectivos do projecto propomos 3 linhas de investigação:
i) melhorar a velocidade de um sistema de ILP, melhorar as capacidades de raciocínio numérico dos sistemas de ILP e, em geral, melhorar a qualidade dos modelos construídos por um sistema de ILP;
ii) simplificar o uso de sistemas de ILP por utilizadores não especialistas; iii)
desenvolver uma plataforma de computação distribuída com um mecanismo de escalonamento complexo que permita gerir as execuções das tarefas de ILP.
Bons resultados em i) tornariam a interacção com o utilizador tão próxima quanto possível do tempo-real e permitirá a construção de melhores modelos pois será possível ir mais longe no espaço de procura. Iremos investigar novas técnicas de execução de sistemas de ILP em paralelo e a combinação entre execução paralela e procura estocástica. Iremos também melhorar as capacidades de raciocínio numérico dos sistemas de ILP uma vez que existem muitas aplicações que são problemas de regressão. Finalmente a qualidade dos modelos pode ser melhorad |
Resumo O principal objectivo do projecto é o desenvolvimento de uma interface Web que permita aos investigadores uilizarem uma ferramenta de análise automática de dados baseada em Indução de Programas em Lógica (Inductive Logic Programming -- ILP). Um investigador pode, neste sítio Web, realizar uma série de análises sofisticadas dos seus dados sem precisar de ter qualquer conhecimento sobre ILP.
Os utilizadores alvo são, neste projecto, investigadores da área das Ciências da Vida familiarizados com alguns serviços Web disponibilizados por universidades em todo o mundo e que permitem análises de dados de Genómica, Proteómica, etc como por exemplo o programa Fasta. A interface é suficientemente genérica para poder ser usada em problemas fora das Ciências da Vida.
Estamos certos que o projecto permitirá aos investigadores alargarem a análise dos seus dados pelo facto de poderem usar com facilidade uma ferramenta poderosa e de modo fácil.
Para alcançar os objectivos do projecto propomos 3 linhas de investigação:
i) melhorar a velocidade de um sistema de ILP, melhorar as capacidades de raciocínio numérico dos sistemas de ILP e, em geral, melhorar a qualidade dos modelos construídos por um sistema de ILP;
ii) simplificar o uso de sistemas de ILP por utilizadores não especialistas; iii)
desenvolver uma plataforma de computação distribuída com um mecanismo de escalonamento complexo que permita gerir as execuções das tarefas de ILP.
Bons resultados em i) tornariam a interacção com o utilizador tão próxima quanto possível do tempo-real e permitirá a construção de melhores modelos pois será possível ir mais longe no espaço de procura. Iremos investigar novas técnicas de execução de sistemas de ILP em paralelo e a combinação entre execução paralela e procura estocástica. Iremos também melhorar as capacidades de raciocínio numérico dos sistemas de ILP uma vez que existem muitas aplicações que são problemas de regressão. Finalmente a qualidade dos modelos pode ser melhorada utilizando procura ao nível das teorias.
O ponto ii) é fundamental para que o sítio Web seja utilizado por investigadores das áreas das Ciências da Vida que não são especialistas em ILP. A interacção consiste em deixar o urilizador comentar modelos apresentados pelo sistema sugerindo modificações através de uma interface baseada em menus. Não é necessário conhecer os parâmetros do sistema de ILP. A plataforma proposta em iii) permite a execução de várias tarefas de ILP em simultâneo. A execução de uma tarefa de ILP pode ser efectuada em modo sequencial ou distribuído. O sistema poderá utilizar ainda recursos computacionais num ambiente de GRID Computing.
Adoptando uma ``filosofia´´ semelhante ao Condor o sistema será capaz de utilizar recursos ociosos disponíveis numa organização, não perturbando o seu normal funcionamento. Poderár aproveitar qualquer PC que não esteja a ser usado.
Os dados dos utilizadores são guardados numa Base de Dados e podem ser públicos ou privados de acordo com o interesse do utilizador.
O projecto será avaliado num conjunto de problemas da área das Ciências da Vida. Serão usados dados de um problema de Relação Estrutura-Actividade (Structure-Activity Relationship) em que o ILP procura explicar o comportamento anti-hipertensão de pequenos péptidos. Num problema de Genómica em que o ILP ajudará a compreender o fenómeno dos exões disjuntivos. O ILP será também aplicado ao problema do Protein Folding prevendo estruturas secundárias. Finalmente o ILP será usado na área médica para: i) estudar o efeito de algumas vacinas para doenças tropicais, como a malária; e ii) ajudar a compreender o mecanismo de infecção de certo vírus que se julga ser semelhante em plantas e animais. |