Capítulo 2 Pensamento estatístico
2.1 População
2.1.1 O que é população?
População - ou população-alvo - refere-se ao conjunto completo sobre o qual se pretende obter informações.13
População é metodologicamente delimitada pelos critérios de inclusão e exclusão do estudo.13
Em estudos observacionais, inicialmente as características geográficas e/ou demográficas, por exemplo, definem a população a ser estudada.13
Em estudos analíticos, a população é inicialmente definida pelos objetivos da pesquisa e, posteriormente, as observações são realizadas na amostra.13
2.2 Amostra
2.3 Unidade de análise
2.3.1 O que é unidade de análise?
A unidade de análise (ou unidade experimental) de pesquisas na área de saúde geralmente é o indivíduo.15
A unidade de análise também pode ser a instituição em estudos multicêntricos (ex.: hospitais, clínicas) ou um estudo publicado em meta-análise (ex.: ensaios clínicos).15
2.3.2 Por que identificar a unidade de análise de um estudo?
- É fundamental identificar corretamente a unidade de análise para evitar inflação do tamanho da amostra (ex.: medidas bilaterais resultando em o dobro de participantes), violações de suposições dos testes de hipótese (ex.: independência entre medidas e/ou unidade de análise) e resultados espúrios em testes de hipótese (ex.: P-valores menores que aqueles observados se a amostra não estivesse inflada).15,16
2.4 Amostragem
2.4.2 Quais métodos de amostragem são usados para obter uma amostra da população?
O método de amostragem é geralmente definido pelas condições de viabilidade do estudo, no que diz respeito a acesso aos participantes, ao tempo de execução e aos custos envolvidos, entre outras.13
Não-probabilísticas ou intencionais:13
Bola de neve.
Conveniência.
Participantes encaminhados.
Probabilísticas:13
Simples.
Sistemática.
Multiestágio.
Estratificada.
Agregada.
2.5 Reamostragem
2.5.1 O que é reamostragem?
Reamostragem é um procedimento que cria vários conjuntos de dados sorteados a partir de um conjunto de dados real - a amostra da população - sem a necessidade de fazer suposições sobre os dados e suas distribuições.14
O procedimento é repetido várias vezes para usar a variabilidade dos resultados para obter um intervalo de confiança do parâmetro no nível de significância \(\alpha\) pré-estabelecido.14
2.5.2 Por que utilizar reamostragem?
Quando se dispõe de dados de apenas 1 amostra, as diversas suposições que são feitas podem não ser atingidas.14
Procedimentos de reamostragem produzem um conjunto de observações escolhidas aleatoriamente da amostra, igualmente representativo da população original.14
Procedimentos de reamostragem permitem estimar o erro-padrão e intervalos de confiança sem a necessidade de tais suposições, sendo, portanto, um conjunto de procedimentos não-paramétricos.14
2.5.3 Quais procedimentos de reamostragem podem ser realizados?
- Bootstrap: Cada iteração gera uma amostra bootstrap do mesmo tamanho do conjunto de dados original escolhendo aleatoriamente observações reais, uma de cada vez. Cada observação tem chances iguais de ser escolhida a cada vez, portanto, algumas observações serão escolhidas mais de uma vez e outras nem serão escolhidas.14