Capítulo 8 Paradoxos estatísticos

8.1 Paradoxos

8.1.1 O que são paradoxos estatísticos?

Paradoxos podem originar da incompreensão ou mal informação da nossa intuição a respeito do fenômeno.⁷²

8.1.2 O que é o paradoxo de Abelson?

.⁷³

8.1.3 O que é o paradoxo de Berkson?

.⁷⁴

8.1.4 O que é o paradoxo de Big Data?

“Quanto maior a quantidade de dados, maior a certeza de que vamos nos enganar”.⁷²

8.1.5 O que é o paradoxo de Ellsberg?

.⁷⁵

8.1.6 O que é o paradoxo de Freedman?

.^76,77

8.1.7 O que é o paradoxo de Hand?

.⁷⁸

8.1.8 O que é o paradoxo de Kelley?

.^REF?

8.1.9 O que é o paradoxo de Lindley?

.⁷⁹

8.1.10 O que é o paradoxo de Lord?

.^80,81

8.1.11 O que é o paradoxo de Proebsting?

.^REF?

8.1.12 O que é o paradoxo de Simpson?

O paradoxo de Simpson ocorre quando a associação entre duas variáveis \(X\) e \(Y\) desaparece ou mesmo reverte sua direção quando condicionadas em uma terceira variável \(Z\).^82,83
Para decisão do paradoxo de Simpson pode-se utilizar o conceito de ‘back-door’, o qual considera os ‘caminhos’ (isto é, associações) no gráfico acíclio direcionado e assegura que todos as associações espúrias do tratamento \(X\) para o desfecho \(Y\) nesse diagrama causal sejam interceptados pela variável \(Z\).⁸⁴
Dependendo do contexto em que os dados foram obtidos — delineamento do estudo, escolha dos instrumentos e dos tipos de variáveis — a melhor escolha para a análise pode variar entre a análise da população agregada ou da subpopulação desagregada.⁸⁴
É possível que em alguns contextos nem a análise agregada ou a desagregada podem oferecer a resposta correta, sendo necessário o uso de outras (mais) covariáveis.⁸⁴

Paradoxo de Simpson representado com dados simulados. Os pontos no gráfico representam observações individuais e as linhas de tendência representam as regressões lineares ajustadas para os dados desagregados da população e agregados por subpopulação.

Figura 8.1: Paradoxo de Simpson representado com dados simulados. Os pontos no gráfico representam observações individuais e as linhas de tendência representam as regressões lineares ajustadas para os dados desagregados da população e agregados por subpopulação.

8.1.13 O que é o paradoxo de Stein?

.⁸⁵

8.1.18 O que é o paradoxo do elevador?

.⁸⁶

8.1.19 O que é o paradoxo da amizade?

.⁸⁷

8.1.20 O que é o paradoxo do menino ou menina?

.⁸⁶

8.1.21 O que é o paradoxo do teste surpresa?

.^REF?

8.1.22 O que é o paradoxo do nó da gravata?

.^REF?

8.1.23 O que é o paradoxo da Bela Adormecida?

.^REF?

Citar como:
Ferreira, Arthur de Sá. Ciência com R: Perguntas e respostas para pesquisadores e analistas de dados. Rio de Janeiro: 1a edição,

Referências

72.

Meng XL. Statistical paradises and paradoxes in big data (I): Law of large populations, big data paradox, and the 2016 US presidential election. The Annals of Applied Statistics. 2018;12(2). doi:10.1214/18-aoas1161sf

73.

Abelson RP. A variance explanation paradox: When a little is a lot. Psychological Bulletin. 1985;97(1):129–133. doi:10.1037/0033-2909.97.1.129

74.

Berkson J. Limitations of the Application of Fourfold Table Analysis to Hospital Data. Biometrics Bulletin. 1946;2(3):47. doi:10.2307/3002000

75.

Ellsberg D. Risk, Ambiguity, and the Savage Axioms. The Quarterly Journal of Economics. 1961;75(4):643. doi:10.2307/1884324

76.

Freedman DA, Freedman DA. A Note on Screening Regression Equations. The American Statistician. 1983;37(2):152–155. doi:10.1080/00031305.1983.10482729

77.

Freedman LS, Pee D. Return to a Note on Screening Regression Equations. The American Statistician. 1989;43(4):279. doi:10.2307/2685389

78.

Hand DJ. On Comparing Two Treatments. The American Statistician. 1992;46(3):190–192. doi:10.1080/00031305.1992.10475881

79.

LINDLEY DV. A STATISTICAL PARADOX. Biometrika. 1957;44(1-2):187–192. doi:10.1093/biomet/44.1-2.187

80.

Lord FM. A paradox in the interpretation of group comparisons. Psychological Bulletin. 1967;68(5):304–305. doi:10.1037/h0025105

81.

Lord FM. Statistical adjustments when comparing preexisting groups. Psychological Bulletin. 1969;72(5):336–337. doi:10.1037/h0028108

82.

Simpson EH. The Interpretation of Interaction in Contingency Tables. Journal of the Royal Statistical Society: Series B (Methodological). 1951;13(2):238–241. doi:10.1111/j.2517-6161.1951.tb00088.x

83.

Blyth CR. On Simpson’s Paradox and the Sure-Thing Principle. Journal of the American Statistical Association. 1972;67(338):364–366. doi:10.1080/01621459.1972.10482387

84.

Pearl J. Comment: Understanding Simpson’s Paradox. The American Statistician. 2014;68(1):8–13. doi:10.1080/00031305.2014.876829

85.

Stein C. INADMISSIBILITY OF THE USUAL ESTIMATOR FOR THE MEAN OF A MULTIVARIATE NORMAL DISTRIBUTION. Em: Proceedings of the Third Berkeley Symposium on Mathematical Statistics and Probability, Volume I. University of California Press; 1956:197–206. doi:10.1525/9780520313880-018

86.

De S, Sen A. The generalised Gamow-Stern problem. The Mathematical Gazette. 1996;80(488):345–348. doi:10.2307/3619568

87.

Feld SL. Why Your Friends Have More Friends Than You Do. American Journal of Sociology. 1991;96(6):1464–1477. doi:10.1086/229693