Capítulo 20 Análise descritiva


20.1 Análise descritiva


20.1.1 O que é análise descritiva?

  • Análise descritiva é usada para compreendermos algum aspecto de um conjunto de dados, respondendo a perguntas do tipo “quando?”, “onde?”, “quem?”, “o quê?”, “como?” e “e daí?”.121,224



20.1.2 Como apresentar os resultados descritivos?

  • Variáveis categóricas: Reporte valores de frequência absoluta e relativa (n, percentual).225

  • Organização das tabelas: as variáveis são exibidas em linhas e os grupos são exibidos em colunas.225

  • Calcule percentagens para as colunas (isto é, entre grupos) e não entre linhas.225

  • Em caso de dados perdidos, não inclua uma linha com total de dados perdidos, pois distorce as proporções entre colunas e as análises de tabela de contingência. Indique no texto ou em uma coluna separada o total de dados perdidos por variável.225


20.2 Apresentação de resultados numéricos


20.2.1 O que são casas decimais?

  • O número de casas decimais refere-se à quantidade de dígitos que aparecem após a vírgula decimal.226,227

  • Para tamanhos de efeito: use 2–3 dígitos significativos.228

  • Para medidas de variabilidade (desvio-padrão/erro-padrão/intervalo de confian’;cça): use 1–2 dígitos significativos.228


20.2.2 O que são dígitos significativos?

  • O termo “dígitos significativos” é preferido a “algarismos significativos” ou “dígitos efetivos” e não se relaciona com significância estatística.226,227

  • O número de dígitos significativos é a soma total de dígitos, desconsiderando a vírgula decimal e os zeros à esquerda; os zeros à direita são considerados informativos, salvo exceções.226,227


20.2.3 Como arredondar dados numéricos?

  • Apresentar dados com quantidade excessiva de casas decimais pode dificultar a interpretação e induzir erroneamente uma precisão espúria.226,227

  • A precisão é determinada pelo grau de arredondamento aplicado, medido em casas decimais ou dígitos significativos.226,227


Tabela 20.1: Quantidade de casas decimais e dígitos significativos.
Valor Casas Decimais Dígitos Significativos
0,00789 5 0
0,0456 4 0
45,6 1 2
123,456 3 3
7890,0000 4 4


  • O arredondamento também introduz erros, uma vez que aumenta a imprecisão (isto é, incerteza) em torno do valor original.226,227


Tabela 20.2: Valores originais, arredondamentos e erros de arredondamento por casas decimais.
Valor Casas Decimais Dígitos Significativos 2 Casas decimais [Margem de erro] 1 Casa decimal [Margem de erro] Sem casa decimal [Margem de erro]
0,00789 5 0 0,01 [0,005, 0,015] 0,0 [-0,05, 0,05] 0 [-0,5, 0,5]
0,0456 4 0 0,05 [0,045, 0,055] 0,0 [-0,05, 0,05] 0 [-0,5, 0,5]
45,6 1 2 45,60 [45,595, 45,605] 45,6 [45,55, 45,65] 46 [45,5, 46,5]
123,456 3 3 123,46 [123,455, 123,465] 123,5 [123,45, 123,55] 123 [122,5, 123,5]
7890,0000 4 4 7890,00 [7889,995, 7890,005] 7890,0 [7889,95, 7890,05] 7890 [7889,5, 7890,5]


  • A regra geral é utilizar 2 ou 3 dígitos significativos para tamanhos de efeito e 1 ou 2 dígitos significativos para medidas de variabilidade.227

  • Regra dos 3 dígitos significativos para proporção de risco: em média, o erro de arredondamento é menor que os 0,5% exigidos, de modo que três dígitos significativos são mais precisos do que o necessário.226

  • Regra dos 4 dígitos significativos para proporção de risco: divida a proporção de risco por quatro e arredonde para dois dígitos significativos e, em seguida, relate a proporção para esse número de casas decimais.226



Citar como:
Ferreira, Arthur de Sá. Ciência com R: Perguntas e respostas para pesquisadores e analistas de dados. Rio de Janeiro: 1a edição,


Referências

62.
R Core Team. R: A Language and Environment for Statistical Computing. Vienna, Austria: R Foundation for Statistical Computing; 2023. https://www.R-project.org/.
121.
Vetter TR. Fundamentals of Research Data and Variables. Anesthesia & Analgesia. 2017;125(4):1375–1380. doi:10.1213/ane.0000000000002370
224.
Gerring J. Mere Description. British Journal of Political Science. 2012;42(4):721–746. doi:10.1017/s0007123412000130
225.
Cummings P, Rivara FP. Reporting Statistical Information in Medical Journal Articles. Archives of Pediatrics & Adolescent Medicine. 2003;157(4):321. doi:10.1001/archpedi.157.4.321
226.
Cole TJ. Setting number of decimal places for reporting risk ratios: rule of four. BMJ. 2015;350(apr27 3):h1845–h1845. doi:10.1136/bmj.h1845
227.
Cole TJ. Too many digits: the presentation of numerical data. Archives of Disease in Childhood. 2015;100(7):608–609. doi:10.1136/archdischild-2014-307149
228.
Weissgerber TL, Winham SJ, Heinzen EP, et al. Reveal, Dont Conceal. Circulation. 2019;140(18):1506–1518. doi:10.1161/circulationaha.118.037777