Capítulo 4 Paradoxos e falácias


4.1 Paradoxos estatísticos


4.1.1 O que são paradoxos estatísticos?

  • Paradoxos podem originar da incompreensão ou mal informação da nossa intuição a respeito do fenômeno.23


4.1.2 O que é o paradoxo de Abelson?


4.1.3 O que é o paradoxo de Berkson?


4.1.4 O que é o paradoxo de Big Data?

  • “Quanto maior a quantidade de dados, maior a certeza de que vamos nos enganar”.23


4.1.5 O que é o paradoxo de Ellsberg?


4.1.6 O que é o paradoxo de Freedman?


4.1.7 O que é o paradoxo de Hand?


4.1.8 O que é o paradoxo de Lindley?


4.1.9 O que é o paradoxo de Lord?


4.1.10 O que é o paradoxo de Proebsting?


4.1.11 O que é o paradoxo de Simpson?

  • O paradoxo de Simpson ocorre quando a associação entre duas variáveis \(X\) e \(Y\) desaparece ou mesmo reverte sua direção quando condicionadas em uma terceira variável \(Z\).33,34

  • Para decisão do paradoxo de Simpson pode-se utilizar o conceito de ‘back-door’, o qual considera os ‘caminhos’ (isto é, associações) no gráfico acíclio direcionado e assegura que todos as associações espúrias do tratamento \(X\) para o desfecho \(Y\) nesse diagrama causal sejam interceptados pela variável \(Z\).35

  • Dependendo do contexto em que os dados foram obtidos — delineamento do estudo, escolha dos instrumentos e dos tipos de variáveis — a melhor escolha para a análise pode variar entre a análise da população agregada ou da subpopulação desagregada.35

  • É possivel que em alguns contextos nem a análise agregada ou a desagregada podem oferecer a resposta correta, sendo necessário o uso de outras (mais) covariáveis.35


Paradoxo de Simpson representado com dados simulados. Os pontos no gráfico representam observações individuais e as linhas de tendência representam as regressões lineares ajustadas para os dados desagregados da população e agregados por subpopulação.

Figura 4.1: Paradoxo de Simpson representado com dados simulados. Os pontos no gráfico representam observações individuais e as linhas de tendência representam as regressões lineares ajustadas para os dados desagregados da população e agregados por subpopulação.


4.1.12 O que é o paradoxo de Stein?


4.1.13 O que é o paradoxo de Okie?


4.1.14 O que é o paradoxo da acurácia?


4.1.15 O que é o paradoxo do falso positivo?


4.1.16 O que é o paradoxo da caixa de Bertrand?


4.1.17 O que é o paradoxo do elevador?


4.1.18 O que é o paradoxo da amizade?


4.1.19 O que é o paradoxo do menino ou menina?


4.1.20 O que é o paradoxo do teste surpresa?


4.1.21 O que é o paradoxo do nó da gravata?


4.1.22 O que é o paradoxo da Bela Adormecida?


4.2 Falácias estatísticas


4.2.1 O que são falácias estatísticas?

  • Falácias estatísticas são erros de raciocínio que ocorrem em situações que envolvem dados e estatísticas. Elas podem ocorrer em qualquer etapa do processo de análise de dados, desde a coleta até a interpretação dos resultados.Elas podem ser intencionais ou não intencionais, e podem ser usadas para manipular, enganar ou confundir as pessoas.REF?

  • As falácias estatísticas podem ser difíceis de detectar, pois muitas vezes são sutis e podem parecer plausíveis à primeira vista. No entanto, é importante estar ciente delas e saber como identificá-las para evitar erros de interpretação e tomada de decisão.REF?


4.2.2 O que é a falácia do jogador?

  • A falácia do jogador é a crença de que eventos independentes têm uma influência sobre eventos futuros. Por exemplo, se uma moeda é lançada várias vezes e cai cara em todas as vezes, a falácia do jogador sugere que a próxima jogada será coroa, pois a moeda “deve” se equilibrar. No entanto, cada lançamento da moeda é independente e não afeta o resultado do próximo lançamento.39


4.2.3 O que é a falácia da mão quente?

  • A falácia da mão quente é a crença de que um jogador que teve sucesso em um jogo de azar terá mais chances de sucesso no futuro. Por exemplo, se uma moeda é lançada várias vezes e cai cara em todas as vezes, a falácia da mão quente sugere que a próxima jogada será cara, pois o jogador está “quente”. No entanto, cada lançamento da moeda é independente e não afeta o resultado do próximo lançamento.39


Referências

23.
Meng XL. Statistical paradises and paradoxes in big data (i): Law of large populations, big data paradox, and the 2016 US presidential election. The Annals of Applied Statistics. 2018;12(2). doi:10.1214/18-aoas1161sf
24.
Abelson RP. A variance explanation paradox: When a little is a lot. Psychological Bulletin. 1985;97(1):129-133. doi:10.1037/0033-2909.97.1.129
25.
Berkson J. Limitations of the application of fourfold table analysis to hospital data. Biometrics Bulletin. 1946;2(3):47. doi:10.2307/3002000
26.
Ellsberg D. Risk, ambiguity, and the savage axioms. The Quarterly Journal of Economics. 1961;75(4):643. doi:10.2307/1884324
27.
Freedman DA, Freedman DA. A Note on Screening Regression Equations. The American Statistician. 1983;37(2):152-155. doi:10.1080/00031305.1983.10482729
28.
Freedman LS, Pee D. Return to a note on screening regression equations. The American Statistician. 1989;43(4):279. doi:10.2307/2685389
29.
Hand DJ. On Comparing Two Treatments. The American Statistician. 1992;46(3):190-192. doi:10.1080/00031305.1992.10475881
30.
LINDLEY DV. A STATISTICAL PARADOX. Biometrika. 1957;44(1-2):187-192. doi:10.1093/biomet/44.1-2.187
31.
Lord FM. A paradox in the interpretation of group comparisons. Psychological Bulletin. 1967;68(5):304-305. doi:10.1037/h0025105
32.
Lord FM. Statistical adjustments when comparing preexisting groups. Psychological Bulletin. 1969;72(5):336-337. doi:10.1037/h0028108
33.
Simpson EH. The Interpretation of Interaction in Contingency Tables. Journal of the Royal Statistical Society: Series B (Methodological). 1951;13(2):238-241. doi:10.1111/j.2517-6161.1951.tb00088.x
34.
Blyth CR. On Simpson’s Paradox and the Sure-Thing Principle. Journal of the American Statistical Association. 1972;67(338):364-366. doi:10.1080/01621459.1972.10482387
35.
Pearl J. Comment: Understanding Simpsons Paradox. The American Statistician. 2014;68(1):8-13. doi:10.1080/00031305.2014.876829
36.
Stein C. INADMISSIBILITY OF THE USUAL ESTIMATOR FOR THE MEAN OF a MULTIVARIATE NORMAL DISTRIBUTION. In: University of California Press; 1956:197-206. doi:10.1525/9780520313880-018
37.
De S, Sen A. The generalised Gamow-Stern problem. The Mathematical Gazette. 1996;80(488):345-348. doi:10.2307/3619568
38.
Feld SL. Why Your Friends Have More Friends Than You Do. American Journal of Sociology. 1991;96(6):1464-1477. doi:10.1086/229693
39.
Polin BA, Benisaac E. A longitudinal analysis of the hot hand and gamblers fallacy biases. Judgment and Decision Making. 2023;18. doi:10.1017/jdm.2023.23