Capítulo 10 Simulação computacional


10.1 Simulações computacionais


10.1.1 O que são simulações computacionais?

  • Simulações computacionais consistem na geração de dados artificiais baseados em regras matemáticas e estatísticas, permitindo testar hipóteses, validar métodos e explorar cenários complexos sem necessidade de dados reais.48

  • A simulação é frequentemente usada em estatística para avaliar o desempenho de testes, estimadores e modelos sob diferentes condições.


10.1.2 Por que usar simulações?

  • Testar o comportamento de métodos estatísticos sob diferentes premissas (ex: normalidade, homocedasticidade, tamanho amostral).

  • Avaliar a robustez de algoritmos computacionais.

  • Reproduzir processos naturais ou sociais para compreensão teórica.


Code
# Simulação de 1000 médias de amostras de tamanho 30 de uma N(0,1)
set.seed(123)
n_sim <- 1000
amostras <- replicate(n_sim, mean(rnorm(30, mean = 0, sd = 1)))
hist(
  amostras,
  main = "Distribuição das médias simuladas",
  xlab = "Média",
  col = "lightblue",
  border = "white"
)


10.1.3 Quais são as boas práticas em simulações computacionais?

  • Defina claramente o objetivo da simulação e as hipóteses a serem testadas, incluindo quais aspectos do fenômeno ou do método você pretende avaliar.100

  • Use uma semente para o gerador de números aleatórios com set.seed() para garantir a reprodutibilidade dos resultados.REF?

  • Documente detalhadamente o processo de simulação, incluindo os parâmetros utilizados, a lógica do algoritmo e as suposições feitas.101

  • Realize múltiplas simulações (ex.: 1000 ou mais) para obter estimativas estáveis e resultados mais robustos e confiáveis.REF?

  • Analise os resultados de forma crítica, considerando a variabilidade, as limitações do modelo e possíveis vieses do processo de simulação.REF?

  • Use funções vetorizadas para otimizar o desempenho e reduzir o tempo de execução da simulação.REF?



10.2 Características


10.2.1 Quais são as características de estudos de simulação computacional?


10.3 Método de Monte Carlo


10.3.1 O que é o método de Monte Carlo?

  • .102

  • No método Markov Chain Monte Carlo (MCMC), o modelo de Markov é usado para gerar amostras de distribuições complexas a partir da simulação de cadeias com distribuição estacionária prescrita.103


Convergência do histograma para a PDF teórica da Normal(0,1) com o aumento do tamanho amostral (n = 10, 100, 1000, 10000).

Figura 10.1: Convergência do histograma para a PDF teórica da Normal(0,1) com o aumento do tamanho amostral (n = 10, 100, 1000, 10000).


Convergência da média e do desvio-padrão amostral para os valores teóricos (0 e 1, respectivamente) com o aumento do tamanho amostral (n = 10, 20, 50, 100, 200, 500, 1000, 2000, 5000, 10000).

Figura 10.2: Convergência da média e do desvio-padrão amostral para os valores teóricos (0 e 1, respectivamente) com o aumento do tamanho amostral (n = 10, 20, 50, 100, 200, 500, 1000, 2000, 5000, 10000).






10.4 Diretrizes para redação


10.4.1 Quais são as diretrizes para redação de estudos de simulação computacional?



Citar como:
Ferreira, Arthur de Sá. Ciência com R: Perguntas e respostas para pesquisadores e analistas de dados. Rio de Janeiro: 1a edição,


Referências

48.
Hinsen K. A data and code model for reproducible research and executable papers. Procedia Computer Science. 2011;4:579–588. doi:10.1016/j.procs.2011.04.061
97.
R Core Team. R: A Language and Environment for Statistical Computing. Vienna, Austria: R Foundation for Statistical Computing; 2023. https://www.R-project.org/.
100.
Eglen SJ, Marwick B, Halchenko YO, et al. Toward standard practices for sharing computer code and programs in neuroscience. Nature Neuroscience. 2017;20(6):770–773. doi:10.1038/nn.4550
101.
Trisovic A, Lau MK, Pasquier T, Crosas M. A large-scale study on research code quality and execution. Scientific Data. 2022;9(1). doi:10.1038/s41597-022-01143-6
102.
Metropolis N, Ulam S. The Monte Carlo Method. Journal of the American Statistical Association. 1949;44(247):335–341. doi:10.1080/01621459.1949.10483310
104.
Goldfeld K, Wujciak-Jens J. simstudy: Illuminating research methods through data generation. Journal of Open Source Software. 2020;5:2763. doi:10.21105/joss.02763
105.
DeBruine L. faux: Simulation for Factorial Designs.; 2023. doi:10.5281/zenodo.2669586
106.
Baranger DAA, Finsaas MC, Goldstein BL, Vize CE, Lynam DR, Olino TM. Tutorial: Power Analyses for Interaction Effects in Cross-Sectional Regressions. Advances in Methods and Practices in Psychological Science. 2023;6(3):25152459231187531. doi:10.1177/25152459231187531
107.
Monks T, Currie CSM, Onggo BS, Robinson S, Kunc M, Taylor SJE. Strengthening the reporting of empirical simulation studies: Introducing the STRESS guidelines. Journal of Simulation. 2018;13(1):55–67. doi:10.1080/17477778.2018.1442155