Capítulo 31 Modelos


31.1 Modelos


31.1.1 O que são modelos?

  • Modelos são representações simplificadas de um sistema real, usados para entender, prever ou controlar fenômenos complexos.REF?


31.1.2 O que é modelagem?

  • Modelagem é o processo de usar dados para selecionar um modelo matemático explícito que represente o processo gerador dos dados.293


31.1.3 Por que a escolha do modelo é complexa?

  • Há inúmeras combinações possíveis de variáveis, formas funcionais (lineares, quadráticas, transformações), interações e formas do desfecho, o que torna o espaço de possibilidades muito amplo.293

  • Todos os modelos são errados, mas alguns são úteis.294



31.2 Modelos estocásticos


31.2.1 O que são modelos estocásticos?


31.2.2 O que são cadeias de Markov?

  • As cadeias de Markov descrevem processos em que o estado futuro depende apenas do estado presente, e não da trajetória passada.103


Cadeia de Markov com 3 estados (a, b, c) e suas probabilidades de transição.

Figura 31.1: Cadeia de Markov com 3 estados (a, b, c) e suas probabilidades de transição.


Trajetória de estados e proporção acumulada por estado em uma cadeia de Markov com 3 estados (a, b, c).

Figura 31.2: Trajetória de estados e proporção acumulada por estado em uma cadeia de Markov com 3 estados (a, b, c).



31.3 Preditores e desfechos


31.3.1 O que são desfechos de um modelo?


31.3.2 O que são preditores de um modelo?


31.3.3 Como selecionar preditores para um modelo?


31.4 Suposições dos modelos


31.4.1 Quais suposições são feitas para modelagem?


31.4.2 Como avaliar as suposições de um modelo?



31.5 Avaliação de modelos


31.5.1 Como avaliar a qualidade de ajuste de um modelo?


Tabela 31.1: Métricas de desempenho do modelo de regressão linear.
Métrica Valor
AIC 513.017
AIC corrigido 513.267
BIC 520.833
\(R^2\) 0.007
\(R^2\) ajustado -0.003
Erro quadrático médio (RMSE) 3.053
Desvio residual (Sigma) 3.084




31.6 Validação de modelos


31.6.1 Como validar modelos estatísticos?


31.7 Calibração de modelos


31.7.1 Como calibrar modelos estatísticos?


31.8 Comparação de modelos


31.8.1 Como comparar modelos de aprendizagem de máquina?




Citar como:
Ferreira, Arthur de Sá. Ciência com R: Perguntas e respostas para pesquisadores e analistas de dados. Rio de Janeiro: 1a edição,


Referências

293.
Greenland S. Modeling and variable selection in epidemiologic analysis. American Journal of Public Health. 1989;79(3):340–349. doi:10.2105/ajph.79.3.340
294.
Box GEP. Science and Statistics. Journal of the American Statistical Association. 1976;71(356):791–799. doi:10.1080/01621459.1976.10480949
295.
Anderson D, Heiss A, Sumners J. equatiomatic: Transform Models into LaTeX Equations.; 2024. https://CRAN.R-project.org/package=equatiomatic.
296.
Spedicato GA. Discrete Time Markov Chains with R. The R Journal. 2017;9(2):84–104. doi:10.32614/RJ-2017-036
297.
Lüdecke D, Ben-Shachar MS, Patil I, Waggoner P, Makowski D. performance: An R Package for Assessment, Comparison and Testing of Statistical Models. Journal of Open Source Software. 2021;6:3139. doi:10.21105/joss.03139
298.
Henderson T. correctR: Corrected Test Statistics for Comparing Machine Learning Models on Correlated Samples.; 2025. https://CRAN.R-project.org/package=correctR.