Capítulo 20 Análise descritiva
20.1 Análise descritiva
20.1.1 O que é análise descritiva?
- Análise descritiva é usada para compreendermos algum aspecto de um conjunto de dados, respondendo a perguntas do tipo “quando?”, “onde?”, “quem?”, “o quê?”, “como?” e “e daí?”.121,224
20.1.2 Como apresentar os resultados descritivos?
Variáveis categóricas: Reporte valores de frequência absoluta e relativa (n, percentual).225
Organização das tabelas: as variáveis são exibidas em linhas e os grupos são exibidos em colunas.225
Calcule percentagens para as colunas (isto é, entre grupos) e não entre linhas.225
Em caso de dados perdidos, não inclua uma linha com total de dados perdidos, pois distorce as proporções entre colunas e as análises de tabela de contingência. Indique no texto ou em uma coluna separada o total de dados perdidos por variável.225
20.2 Apresentação de resultados numéricos
20.2.1 O que são casas decimais?
O número de casas decimais refere-se à quantidade de dígitos que aparecem após a vírgula decimal.226,227
Para tamanhos de efeito: use 2–3 dígitos significativos.228
Para medidas de variabilidade (desvio-padrão/erro-padrão/intervalo de confian’;cça): use 1–2 dígitos significativos.228
20.2.2 O que são dígitos significativos?
O termo “dígitos significativos” é preferido a “algarismos significativos” ou “dígitos efetivos” e não se relaciona com significância estatística.226,227
O número de dígitos significativos é a soma total de dígitos, desconsiderando a vírgula decimal e os zeros à esquerda; os zeros à direita são considerados informativos, salvo exceções.226,227
20.2.3 Como arredondar dados numéricos?
Apresentar dados com quantidade excessiva de casas decimais pode dificultar a interpretação e induzir erroneamente uma precisão espúria.226,227
A precisão é determinada pelo grau de arredondamento aplicado, medido em casas decimais ou dígitos significativos.226,227
| Valor | Casas Decimais | Dígitos Significativos |
|---|---|---|
| 0,00789 | 5 | 0 |
| 0,0456 | 4 | 0 |
| 45,6 | 1 | 2 |
| 123,456 | 3 | 3 |
| 7890,0000 | 4 | 4 |
- O arredondamento também introduz erros, uma vez que aumenta a imprecisão (isto é, incerteza) em torno do valor original.226,227
| Valor | Casas Decimais | Dígitos Significativos | 2 Casas decimais [Margem de erro] | 1 Casa decimal [Margem de erro] | Sem casa decimal [Margem de erro] |
|---|---|---|---|---|---|
| 0,00789 | 5 | 0 | 0,01 [0,005, 0,015] | 0,0 [-0,05, 0,05] | 0 [-0,5, 0,5] |
| 0,0456 | 4 | 0 | 0,05 [0,045, 0,055] | 0,0 [-0,05, 0,05] | 0 [-0,5, 0,5] |
| 45,6 | 1 | 2 | 45,60 [45,595, 45,605] | 45,6 [45,55, 45,65] | 46 [45,5, 46,5] |
| 123,456 | 3 | 3 | 123,46 [123,455, 123,465] | 123,5 [123,45, 123,55] | 123 [122,5, 123,5] |
| 7890,0000 | 4 | 4 | 7890,00 [7889,995, 7890,005] | 7890,0 [7889,95, 7890,05] | 7890 [7889,5, 7890,5] |
A regra geral é utilizar 2 ou 3 dígitos significativos para tamanhos de efeito e 1 ou 2 dígitos significativos para medidas de variabilidade.227
Regra dos 3 dígitos significativos para proporção de risco: em média, o erro de arredondamento é menor que os 0,5% exigidos, de modo que três dígitos significativos são mais precisos do que o necessário.226
Regra dos 4 dígitos significativos para proporção de risco: divida a proporção de risco por quatro e arredonde para dois dígitos significativos e, em seguida, relate a proporção para esse número de casas decimais.226
Ferreira, Arthur de Sá. Ciência com R: Perguntas e respostas para pesquisadores e analistas de dados. Rio de Janeiro: 1a edição,