Capítulo 5 Pensamento estatístico


5.1 População


5.1.1 O que é população?

  • População — ou população-alvo — refere-se ao conjunto completo sobre o qual se pretende obter informações.47,65

  • População é metodologicamente delimitada pelos critérios de inclusão e exclusão do estudo.47

  • Em estudos observacionais, inicialmente as características geográficas e/ou demográficas, por exemplo, definem a população a ser estudada.47

  • Em estudos analíticos, a população é inicialmente definida pelos objetivos da pesquisa e, posteriormente, as observações são realizadas na amostra.47


5.1.2 O que é representatividade e por que ela importa?

  • Representatividade refere-se ao grau em que uma amostra reflete com fidelidade as características da população de referência.65

  • Mesmo com uma amostra menor que o ideal, a inferência estatística ainda pode ser válida se a representatividade for mantida, embora com menor precisão e poder estatístico.65

  • Amostras não representativas comprometem a validade da inferência estatística, mesmo quando o tamanho da amostra atende aos requisitos de poder da análise.65


5.2 Amostra


5.2.1 O que é amostra?

  • Amostra é uma parte finita da população do estudo.47,65

  • Em pesquisa científica, utilizam-se dados de uma amostra de participantes (ou outras unidades de análise) para realizar inferências sobre a população.66


5.2.2 Por que usar dados de amostras?

  • Estudos com amostras, em vez de censos, são preferíveis por diversas razões, dentre elas: questões éticas; limitações orçamentárias; desafios logísticos; restrição de tempo; e tamanho populacional desconhecido.65

  • Dados de uma amostra de tamanho suficiente e características representativas podem ser utilizados para inferência sobre uma população.60

  • Em geral, amostras de tamanhos maiores possuem médias mais próximas da média populacional e menores variâncias.60


5.3 Unidade de análise


5.3.1 O que é unidade de análise?

  • A unidade de análise (ou unidade experimental) de pesquisas na área de saúde geralmente é o indivíduo.67

  • A unidade de análise também pode ser a instituição em estudos multicêntricos (ex.: hospitais, clínicas) ou um estudo publicado em meta-análise (ex.: ensaios clínicos).67


5.3.2 Por que identificar a unidade de análise de um estudo?

  • É fundamental identificar corretamente a unidade de análise para evitar inflação do tamanho da amostra, violações de suposições dos testes de hipótese e resultados espúrios em testes de hipótese.67,68


5.4 Amostragem


5.4.1 O que é amostragem?

  • Amostragem é o processo pelo qual se seleciona uma parte de uma população para constituir a amostra que será efetivamente estudada.65


Representação esquemática da amostragem: seleção de uma população para a amostra.

Figura 5.1: Representação esquemática da amostragem: seleção de uma população para a amostra.


5.4.2 Quais métodos de amostragem da população são usados?

  • O método de amostragem é geralmente definido pelas condições de viabilidade do estudo, no que diz respeito a acesso aos participantes, ao tempo de execução e aos custos envolvidos, entre outras.47

  • Amostragem não-probabilística ou intencional: Bola de neve, Conveniência, Participantes encaminhados, Proposital.47,65

  • Amostragem probabilística: Simples, Sistemática, Multiestágio, Estratificada, Agregada.47,65


5.4.3 O que é erro de amostragem?

  • Erro de amostragem é a variação natural entre os resultados obtidos a partir de uma amostra e os resultados que seriam obtidos caso toda a população fosse examinada.65

  • Erro de amostragem reflete o grau de incerteza inerente à generalização de uma amostra para a população.65


Representação esquemática do erro de amostragem: seleção de várias amostras independentes de uma população.

Figura 5.2: Representação esquemática do erro de amostragem: seleção de várias amostras independentes de uma população.


Representação esquemática da amostragem de uma população para a amostra.

Figura 5.3: Representação esquemática da amostragem de uma população para a amostra.


5.5 Reamostragem


5.5.1 O que é reamostragem?

  • Reamostragem é um procedimento que cria vários conjuntos de dados sorteados a partir de um conjunto de dados real — a amostra da população — sem a necessidade de fazer suposições sobre os dados e suas distribuições.66


5.5.2 Por que utilizar reamostragem?

  • Quando se dispõe de dados de apenas 1 amostra, as diversas suposições que são feitas podem não ser atingidas.66

  • Procedimentos de reamostragem produzem um conjunto de observações escolhidas aleatoriamente da amostra, igualmente representativo da população original.66

  • Procedimentos de reamostragem permitem estimar o erro-padrão e intervalos de confiança sem a necessidade de tais suposições, sendo, portanto, um conjunto de procedimentos não-paramétricos.66


5.5.3 Quais métodos de reamostragem podem ser realizados?

  • Bootstrap: Cada iteração cria uma nova amostra do mesmo tamanho da original a partir de seleções aleatórias das observações reais.66

  • Com bootstrap, algumas observações podem aparecer mais de uma vez, enquanto outras podem não ser selecionadas.66


Representação esquemática da reamostragem de uma amostra.

Figura 5.4: Representação esquemática da reamostragem de uma amostra.


5.6 Subamostragem


5.6.1 O que é subamostragem?


Representação esquemática da subamostragem de uma amostra.

Figura 5.5: Representação esquemática da subamostragem de uma amostra.


5.7 Superamostragem


5.7.1 O que é superamostragem?


Representação esquemática da superamostragem de uma população.

Figura 5.6: Representação esquemática da superamostragem de uma população.



Citar como:
Ferreira, Arthur de Sá. Ciência com R: Perguntas e respostas para pesquisadores e analistas de dados. Rio de Janeiro: 1a edição,


Referências

47.
Banerjee A, Chaudhury S. Statistics without tears: Populations and samples. Industrial Psychiatry Journal. 2010;19(1):60. doi:10.4103/0972-6748.77642
60.
Kwak SG, Kim JH. Central limit theorem: the cornerstone of modern statistics. Korean Journal of Anesthesiology. 2017;70(2):144. doi:10.4097/kjae.2017.70.2.144
65.
Martínez-Mesa J, González-Chica DA, Duquia RP, Bonamigo RR, Bastos JL. Sampling: how to select participants in my research study? Anais Brasileiros de Dermatologia. 2016;91(3):326–330. doi:10.1590/abd1806-4841.20165254
66.
Bland JM, Altman DG. Statistics Notes: Bootstrap resampling methods. BMJ. 2015;350(jun02 13):h2622–h2622. doi:10.1136/bmj.h2622
67.
Altman DG, Bland JM. Statistics Notes: Units of analysis. BMJ. 1997;314(7098):1874–1874. doi:10.1136/bmj.314.7098.1874
68.
Matthews JN, Altman DG, Campbell MJ, Royston P. Analysis of serial measurements in medical research. BMJ. 1990;300(6719):230–235. doi:10.1136/bmj.300.6719.230