Variáveis | Resolução Temporal | ||
---|---|---|---|
Anual | Trimestral | Mensal | |
PIB | ✓ | ✓ | ✓ |
População | ✓ | ✗ | ✗ |
Sinistros em rodovias federais | ✓ | ✓ | ✓ |
Condutores Habilitados | ✓ | ✗ | ✗ |
Frota veicular | ✓ | ✓ | ✓ |
Óbitos em sinistros de trânsito | ✓ | ✓ | ✓ |
Modelagem orientada a dados relacionados à segurança viária para o reconhecimento de padrões e previsão de óbitos no trânsito
Observatório Nacional de Segurança Viária
Observatório Nacional de Segurança Viária
Presente cenário da segurança viária mundial e brasileira (WORLD HEALTH ORGANIZATION, 2023);
Diversos países com demanda por modelos estatísticos preditivos (RODRÍGUEZ; JATTIN; SORACIPA, 2020);
Defasagem nas fontes de dados: Sistema de Mortalidade - DataSUS;
Ocorrência de vítimas fatais no trânsito se relaciona com diversos atributos estruturais, socioeconômicos e ambientais (ZHONG-XIANG et al., 2014);
Desenvolvimento do PNATRANS.
Modelos Preditivos na Literatura:
Modelos Lineares Multivariados (BLUMENBERG et al., 2018; CAI; ZHU; YAN, 2015);
Cadeia de Markov (JIN; ZHENG; GENG, 2020; SENETA, 1996);
Modelos Autorregressivos (AL-GHAMDI, 1995);
Redes Neurais Artificiais (JAFARI et al., 2015).
Desenvolver um modelo capaz de prever óbitos em sinistros de trânsito;
Explicar a influência e importância das variáveis;
Avaliar desempenho de diferentes abordagens (Determinística e Temporal);
Avaliar o desempenho de diferentes escalas temporais.
Dados coletados de diversas fontes, com diferentes escalas de tempo;
Diferentes modelos são ajustados de acordo com a disponibiliade de dados:
Variáveis | Resolução Temporal | ||
---|---|---|---|
Anual | Trimestral | Mensal | |
PIB | ✓ | ✓ | ✓ |
População | ✓ | ✗ | ✗ |
Sinistros em rodovias federais | ✓ | ✓ | ✓ |
Condutores Habilitados | ✓ | ✗ | ✗ |
Frota veicular | ✓ | ✓ | ✓ |
Óbitos em sinistros de trânsito | ✓ | ✓ | ✓ |
microdatasus
(SALDANHA, 2023) da linguagem de programação estatística R.Indisponibilidade de dados é um grande obstáculo na confecção de modelos mais complexos e custosos;
Diferentes abordagens são testadas a fim de encontrar a metodologia ideal para modelagem da fatalidade dos sinistros.
Modelos | Resolução Temporal | ||
---|---|---|---|
Anual | Trimestral | Mensal | |
Determinístico | |||
Regressão Linear | ✓ | ✓ | ✓ |
Random Forest | ✗ | ✗ | ✓ |
Série Temporal | |||
SARIMA | ✗ | ✗ | ✓ |
Suavização Exponencial | ✗ | ✗ | ✓ |
Duas abordagens estatísticas utilizadas no estudo.
Análise de Série Temporal:
Análise Determinística:
Variável | Coeficientes | p-valor |
---|---|---|
Intercepto Y | 37542.33 | 0.00 |
Frota | 7214.08 | 0.35 |
Sinistros fatais | 8525.89 | 0.03 |
Sinistros | -3804.87 | 0.30 |
Condutores | -7205.39 | 0.37 |
Métricas utilizadas:
Modelos | Métricas | ||
---|---|---|---|
RMSE | MAE | RSQ | |
Anual | |||
Regressão Linear | 707,61 | 668,47 | 0,98 |
Trimestral | |||
Regressão Linear | 314,27 | 274,95 | 0,94 |
Mensal | |||
Regressão Linear | 131,02 | 101,78 | 0,91 |
Random Forest Regressor | 151,75 | 105,14 | 0,92 |
Exponential Smoothing | 154,28 | 120,24 | 0,87 |
SARIMA | 139,48 | 106,69 | 0,89 |
O custo financeiro dos 34.631 óbitos previstos pelo modelo anual linear para 2023 foi estimado com base nos custos médios elaborados pelo Instituto de Pesquisa Econômica Aplicada (IPEA) em CARVALHO (2020);
O cálculo é corrigido monetariamente utilizando o Índice Nacional de Preços ao Consumidor Amplo (IPCA) acumulado de Dez/2014 à Dez/2023 (fator de 68,14%), por meio de: \[ \begin{aligned} Custo_{\small2023} &= Óbitos_{\small2023} \times Custo_{\small2014} \times (1 + \mbox{IPCA}) \\ &= 34.631 \times \text{R\$ } 433.286,69 \times (1 + 0,6814) \\ &= \text{R\$ } 25.229.661.499,04 \end{aligned} \]
Têm-se um custo por óbito de R$ 728.528,24 e um custo total em 2023 de R$ 25.229.661.499,04, ou seja, aproximadamente R$ 25.2 Bi.