Resumo (PT):
Actualmente, as universidades acumulam grandes quantidades de dados sobre os seus estudantes. Apesar do seu potencial para informar decisões sobre a alocação de recursos e esforços, esta informação tende a ser ignorada. Data Mining Educacional é uma área de investigação recente que se foca no uso de técnicas de data mining para transformar grandes volumes de dados educacionais em conhecimento útil e relevante que possa melhorar as decisões e os processos educativos.
Este projecto pretende propôr um conjunto de três modelos. Os primeiros dois modelos irão utilizar informação disponível no início do primeiro e segundo semestres, respectivamente, do primeiro ano do percurso académico do estudante para prever o sucesso académico de alunos da FEUP no final desse semestre. O terceiro modelo irá utilizar os dados disponíveis ao final do primeiro ano para prever o desempenho académico dos estudantes da FEUP aquando do final do seu curso. Ao mesmo tempo, este projecto também pretende identificar os factores com maior poder discriminativo nestes modelos.
Os resultados deste projecto poderão permitir aos directores das faculdades identificar estudantes com necessidade de apoio pedagógico, assim como aqueles com uma alta probabilidade de obter resultados excelentes. Também poderão permitir que foquem a sua atenção nos aspectos mais críticos, através da implementação de mecanismos que combatam as dificuldades dos estudantes.
O primeiro passo do projecto desenvolvido consiste em processos de limpeza e preparação de dados que normalizam os dados recolhidos do sistema de informação da universidade e na definição das variáveis derivadas. O segundo passo é uma análise empírica dos diferentes algoritmos com modelos interpretáveis de forma a identificar os modelos mais apropriados às tarefas de prever sucesso e desempenho académico com os dados de entrada disponíveis. Por último, serão apresentadas análises dos modelos gerados, assim como a identificação dos seus principais atributos predictivos.
Abstract (EN):
Currently, universities record large amounts of data about students. Despite its potential to inform decisions regarding the allocation of resources and efforts, this information tends to be overlooked. Educational data mining is a recent research field that focuses on the use of data mining techniques to transform large volumes of educational data into useful and relevant knowledge that can improve the educational processes and decisions.
This work intends to propose a set of three models. The first two will use the information available at start of the first semester and second semester, respectively, of the first year of the student's academic path to predict the academic success of the students enrolled at FEUP at the end of that semester. The third model will use the information available at the end of the first year to predict the academic performance of the students enrolled at FEUP at the end of their degree. At the same time, this work also intends to identify the factors that are the most critical to these models.
The results of this project could allow college principals to identify students in need of more pedagogical support, as well as students with a high probability of excelling in their studies. It could also allow them to focus their attention on the critical aspects, by implementing mechanisms that tackle students' difficulties.
The first step of the developed work consists of data cleaning and preparation processes that normalize the data retrieved from the university's information system and the definition of the derived variables. The second step is an empirical analysis of different algorithms with interpretable models in order to identify the models best suited for the tasks of predicting academic success regarding their performance with the available entry data. Thirdly, an analysis of the generated models will be presented, along with the identification of their main predictive attributes.
Idioma:
Inglês
Nº de páginas:
90