| Variáveis | Resolução Temporal | ||
|---|---|---|---|
| Anual | Trimestral | Mensal | |
| PIB | ✓ | ✓ | ✓ |
| População | ✓ | ✗ | ✗ |
| Sinistros em rodovias federais | ✓ | ✓ | ✓ |
| Condutores Habilitados | ✓ | ✗ | ✗ |
| Frota veicular | ✓ | ✓ | ✓ |
| Óbitos em sinistros de trânsito | ✓ | ✓ | ✓ |
Modelagem orientada a dados relacionados à segurança viária para o reconhecimento de padrões e previsão de óbitos no trânsito
Observatório Nacional de Segurança Viária
Observatório Nacional de Segurança Viária
Presente cenário da segurança viária mundial e brasileira (WORLD HEALTH ORGANIZATION, 2023);
Diversos países com demanda por modelos estatísticos preditivos (RODRÍGUEZ; JATTIN; SORACIPA, 2020);
Defasagem nas fontes de dados: Sistema de Mortalidade - DataSUS;
Ocorrência de vítimas fatais no trânsito se relaciona com diversos atributos estruturais, socioeconômicos e ambientais (ZHONG-XIANG et al., 2014);
Desenvolvimento do PNATRANS.
Modelos Preditivos na Literatura:
Modelos Lineares Multivariados (BLUMENBERG et al., 2018; CAI; ZHU; YAN, 2015);
Cadeia de Markov (JIN; ZHENG; GENG, 2020; SENETA, 1996);
Modelos Autorregressivos (AL-GHAMDI, 1995);
Redes Neurais Artificiais (JAFARI et al., 2015).
Desenvolver um modelo capaz de prever óbitos em sinistros de trânsito;
Explicar a influência e importância das variáveis;
Avaliar desempenho de diferentes abordagens (Determinística e Temporal);
Avaliar o desempenho de diferentes escalas temporais.
Dados coletados de diversas fontes, com diferentes escalas de tempo;
Diferentes modelos são ajustados de acordo com a disponibiliade de dados:
| Variáveis | Resolução Temporal | ||
|---|---|---|---|
| Anual | Trimestral | Mensal | |
| PIB | ✓ | ✓ | ✓ |
| População | ✓ | ✗ | ✗ |
| Sinistros em rodovias federais | ✓ | ✓ | ✓ |
| Condutores Habilitados | ✓ | ✗ | ✗ |
| Frota veicular | ✓ | ✓ | ✓ |
| Óbitos em sinistros de trânsito | ✓ | ✓ | ✓ |
microdatasus (SALDANHA, 2023) da linguagem de programação estatística R.Indisponibilidade de dados é um grande obstáculo na confecção de modelos mais complexos e custosos;
Diferentes abordagens são testadas a fim de encontrar a metodologia ideal para modelagem da fatalidade dos sinistros.
| Modelos | Resolução Temporal | ||
|---|---|---|---|
| Anual | Trimestral | Mensal | |
| Determinístico | |||
| Regressão Linear | ✓ | ✓ | ✓ |
| Random Forest | ✗ | ✗ | ✓ |
| Série Temporal | |||
| SARIMA | ✗ | ✗ | ✓ |
| Suavização Exponencial | ✗ | ✗ | ✓ |
Duas abordagens estatísticas utilizadas no estudo.
Análise de Série Temporal:
Análise Determinística:
| Variável | Coeficientes | p-valor |
|---|---|---|
| Intercepto Y | 37542.33 | 0.00 |
| Frota | 7214.08 | 0.35 |
| Sinistros fatais | 8525.89 | 0.03 |
| Sinistros | -3804.87 | 0.30 |
| Condutores | -7205.39 | 0.37 |
Métricas utilizadas:
| Modelos | Métricas | ||
|---|---|---|---|
| RMSE | MAE | RSQ | |
| Anual | |||
| Regressão Linear | 707,61 | 668,47 | 0,98 |
| Trimestral | |||
| Regressão Linear | 314,27 | 274,95 | 0,94 |
| Mensal | |||
| Regressão Linear | 131,02 | 101,78 | 0,91 |
| Random Forest Regressor | 151,75 | 105,14 | 0,92 |
| Exponential Smoothing | 154,28 | 120,24 | 0,87 |
| SARIMA | 139,48 | 106,69 | 0,89 |
O custo financeiro dos 34.631 óbitos previstos pelo modelo anual linear para 2023 foi estimado com base nos custos médios elaborados pelo Instituto de Pesquisa Econômica Aplicada (IPEA) em CARVALHO (2020);
O cálculo é corrigido monetariamente utilizando o Índice Nacional de Preços ao Consumidor Amplo (IPCA) acumulado de Dez/2014 à Dez/2023 (fator de 68,14%), por meio de: \[ \begin{aligned} Custo_{\small2023} &= Óbitos_{\small2023} \times Custo_{\small2014} \times (1 + \mbox{IPCA}) \\ &= 34.631 \times \text{R\$ } 433.286,69 \times (1 + 0,6814) \\ &= \text{R\$ } 25.229.661.499,04 \end{aligned} \]
Têm-se um custo por óbito de R$ 728.528,24 e um custo total em 2023 de R$ 25.229.661.499,04, ou seja, aproximadamente R$ 25.2 Bi.
![]()