Resumo (PT):
A priorização de variáveis no processo de modelagem de acidentes pode contribuir para otimização de recursos e
indicação de quais dados são prioritários para coleta. Assim, este estudo objetivou investigar a influência da
priorização de variáveis no ajuste de modelos de previsão de acidentes de resposta multivariada (número de
acidentes sem vítimas, número de acidentes com vítimas e número de acidentes com mortes). Duas abordagens
foram empregadas: técnicas de agrupamento de árvores de decisão (Random Forest e Boosted Trees) para a
priorização inicial e posterior modelagem com uso de redes neurais artificiais (RNA); e, utilização direta de
RNA para priorização e modelagem. Os resultados gerais, entretanto, indicaram piora no ajuste dos modelos
quando da redução do número de variáveis explicativas. Apesar disso, acredita-se que a evolução de técnicas de
aprendizado de máquina de dados que lidem melhor com resposta multivariada, conduzam à identificação
adequada das variáveis mais importantes para modelagem.
Abstract (EN):
The prioritization of variables in the process of accident modeling can contribute to the optimization of resource
and indication of which data are priority to collect. This study aimed to investigate the influence of the
prioritization of variables in the adjustment of accident predictive models of multivariate response (number of
accidents without victims, number of accidents with victims and number of accidents with deaths). Two
approaches were used: decision tree grouping techniques (Random Forest and Boosted Trees) for initial
prioritization and later modeling using artificial neural networks (ANN); and, direct use of ANN for both,
prioritization and modeling. Overall results, however, indicated a worse fitness of the models when the number
of explanatory variables was reduced. Despite this, it is believed that the evolution of machine learning
techniques that best deal with multivariate response, lead to the adequate identification of the most important
variables for modeling.
Language:
English
Type (Professor's evaluation):
Scientific
No. of pages:
12