Capítulo 2 Pensamento estatístico


2.1 População


2.1.1 O que é população?

  • População - ou população-alvo - refere-se ao conjunto completo sobre o qual se pretende obter informações.13

  • População é metodologicamente delimitada pelos critérios de inclusão e exclusão do estudo.13

  • Em estudos observacionais, inicialmente as características geográficas e/ou demográficas, por exemplo, definem a população a ser estudada.13

  • Em estudos analíticos, a população é inicialmente definida pelos objetivos da pesquisa e, posteriormente, as observações são realizadas na amostra.13


2.2 Amostra


2.2.1 O que é amostra?

  • Amostra é uma parte finita da população do estudo.13

  • Em pesquisa científica, utilizam-se dados de uma amostra de participantes (ou outras unidades de análise) para realizar inferências sobre a população.14


2.2.2 Por que usar dados de amostras?

  • Dados de uma amostra de tamanho suficiente e características representativas podem ser utilizados para inferência sobre uma população.8

  • Em geral, amostras de tamanhos maiores possuem médias mais próximas da média populacional e menores variâncias.8


2.3 Unidade de análise


2.3.1 O que é unidade de análise?

  • A unidade de análise (ou unidade experimental) de pesquisas na área de saúde geralmente é o indivíduo.15

  • A unidade de análise também pode ser a instituição em estudos multicêntricos (ex.: hospitais, clínicas) ou um estudo publicado em meta-análise (ex.: ensaios clínicos).15


2.3.2 Por que identificar a unidade de análise de um estudo?

  • É fundamental identificar corretamente a unidade de análise para evitar inflação do tamanho da amostra (ex.: medidas bilaterais resultando em o dobro de participantes), violações de suposições dos testes de hipótese (ex.: independência entre medidas e/ou unidade de análise) e resultados espúrios em testes de hipótese (ex.: P-valores menores que aqueles observados se a amostra não estivesse inflada).15,16


2.3.3 Que medidas podem ser obtidas da unidade de análise de um estudo?

  • Da unidade de análise podem ser coletadas informações em medidas únicas, repetidas, seriadas ou múltiplas.


2.4 Amostragem


2.4.1 O que é amostragem?


2.4.2 Quais métodos de amostragem são usados para obter uma amostra da população?

  • O método de amostragem é geralmente definido pelas condições de viabilidade do estudo, no que diz respeito a acesso aos participantes, ao tempo de execução e aos custos envolvidos, entre outras.13

  • Não-probabilísticas ou intencionais:13

    • Bola de neve.

    • Conveniência.

    • Participantes encaminhados.

  • Probabilísticas:13

    • Simples.

    • Sistemática.

    • Multiestágio.

    • Estratificada.

    • Agregada.


2.4.3 O que é erro de amostragem?


2.5 Reamostragem


2.5.1 O que é reamostragem?

  • Reamostragem é um procedimento que cria vários conjuntos de dados sorteados a partir de um conjunto de dados real - a amostra da população - sem a necessidade de fazer suposições sobre os dados e suas distribuições.14

  • O procedimento é repetido várias vezes para usar a variabilidade dos resultados para obter um intervalo de confiança do parâmetro no nível de significância \(\alpha\) pré-estabelecido.14


2.5.2 Por que utilizar reamostragem?

  • Quando se dispõe de dados de apenas 1 amostra, as diversas suposições que são feitas podem não ser atingidas.14

  • Procedimentos de reamostragem produzem um conjunto de observações escolhidas aleatoriamente da amostra, igualmente representativo da população original.14

  • Procedimentos de reamostragem permitem estimar o erro-padrão e intervalos de confiança sem a necessidade de tais suposições, sendo, portanto, um conjunto de procedimentos não-paramétricos.14


2.5.3 Quais procedimentos de reamostragem podem ser realizados?

  • Bootstrap: Cada iteração gera uma amostra bootstrap do mesmo tamanho do conjunto de dados original escolhendo aleatoriamente observações reais, uma de cada vez. Cada observação tem chances iguais de ser escolhida a cada vez, portanto, algumas observações serão escolhidas mais de uma vez e outras nem serão escolhidas.14


2.6 Subamostragem e superamostragem


2.6.1 O que é subamostragem?


2.6.2 O que é superamostragem?


Referências

8.
Kwak SG, Kim JH. Central limit theorem: the cornerstone of modern statistics. Korean Journal of Anesthesiology. 2017;70(2):144. doi:10.4097/kjae.2017.70.2.144
13.
Banerjee A, Chaudhury S. Statistics without tears: Populations and samples. Industrial Psychiatry Journal. 2010;19(1):60. doi:10.4103/0972-6748.77642
14.
Bland JM, Altman DG. Statistics Notes: Bootstrap resampling methods. BMJ. 2015;350(jun02 13):h2622-h2622. doi:10.1136/bmj.h2622
15.
Altman DG, Bland JM. Statistics Notes: Units of analysis. BMJ. 1997;314(7098):1874-1874. doi:10.1136/bmj.314.7098.1874
16.
Matthews JN, Altman DG, Campbell MJ, Royston P. Analysis of serial measurements in medical research. BMJ. 1990;300(6719):230-235. doi:10.1136/bmj.300.6719.230