Capítulo 24 Análise descritiva


24.1 Análise descritiva


24.1.1 O que é análise descritiva?

  • Análise descritiva é usada para compreendermos algum aspecto de um conjunto de dados, respondendo a perguntas do tipo “quando?”, “onde?”, “quem?”, “o quê?”, “como?” e “e daí?”.136,277

  • A análise descritiva utiliza métodos para calcular, descrever e resumir os dados coletados da(s) amostra(s) de modo que sejam interpretadas adequadamente.136

  • As análises descritivas geralmente compreendem a apresentação quantitativa (numérica) em tabelas e/ou gráficos.136








24.1.2 Como apresentar os resultados descritivos?

  • Variáveis categóricas: Reporte valores de frequência absoluta e relativa (n, percentual).283

  • Organização das tabelas: as variáveis são exibidas em linhas e os grupos são exibidos em colunas.283

  • Calcule percentagens para as colunas (isto é, entre grupos) e não entre linhas.283

  • Em caso de dados perdidos, não inclua uma linha com total de dados perdidos, pois distorce as proporções entre colunas e as análises de tabela de contingência. Indique no texto ou em uma coluna separada o total de dados perdidos por variável.283


24.2 Apresentação de resultados numéricos


24.2.1 O que são casas decimais?

  • O número de casas decimais refere-se à quantidade de dígitos que aparecem após a vírgula decimal.284,285

  • Para tamanhos de efeito: use 2–3 dígitos significativos.235

  • Para medidas de variabilidade: use 1–2 dígitos significativos.235


24.2.2 O que são dígitos significativos?

  • O termo “dígitos significativos” é preferido a “algarismos significativos” ou “dígitos efetivos” e não se relaciona com significância estatística.284,285

  • O número de dígitos significativos é a soma total de dígitos, desconsiderando a vírgula decimal e os zeros à esquerda; os zeros à direita são considerados informativos, salvo exceções.284,285


24.2.3 Como arredondar dados numéricos?

  • Apresentar dados com quantidade excessiva de casas decimais pode dificultar a interpretação e induzir erroneamente uma precisão espúria.284,285

  • A precisão é determinada pelo grau de arredondamento aplicado, medido em casas decimais ou dígitos significativos.284,285


Tabela 24.1: Quantidade de casas decimais e dígitos significativos.
Valor Casas Decimais Dígitos Significativos
0,00789 5 0
0,0456 4 0
45,6 1 2
123,456 3 3
7890,0000 4 4


  • O arredondamento também introduz erros, uma vez que aumenta a imprecisão (isto é, incerteza) em torno do valor original.284,285


Tabela 24.2: Valores originais, arredondamentos e erros de arredondamento por casas decimais.
Valor Casas Decimais Dígitos Significativos 2 Casas decimais [Margem de erro] 1 Casa decimal [Margem de erro] Sem casa decimal [Margem de erro]
0,00789 5 0 0,01 [0,005, 0,015] 0,0 [-0,05, 0,05] 0 [-0,5, 0,5]
0,0456 4 0 0,05 [0,045, 0,055] 0,0 [-0,05, 0,05] 0 [-0,5, 0,5]
45,6 1 2 45,60 [45,595, 45,605] 45,6 [45,55, 45,65] 46 [45,5, 46,5]
123,456 3 3 123,46 [123,455, 123,465] 123,5 [123,45, 123,55] 123 [122,5, 123,5]
7890,0000 4 4 7890,00 [7889,995, 7890,005] 7890,0 [7889,95, 7890,05] 7890 [7889,5, 7890,5]


  • A regra geral é utilizar 2 ou 3 dígitos significativos para tamanhos de efeito e 1 ou 2 dígitos significativos para medidas de variabilidade.285

  • Regra dos 3 dígitos significativos para proporção de risco: em média, o erro de arredondamento é menor que os 0,5% exigidos, de modo que três dígitos significativos são mais precisos do que o necessário.284

  • Regra dos 4 dígitos significativos para proporção de risco: divida a proporção de risco por quatro e arredonde para dois dígitos significativos e, em seguida, relate a proporção para esse número de casas decimais.284



Citar como:
Ferreira, Arthur de Sá. Ciência com R: Perguntas e respostas para pesquisadores e analistas de dados. Rio de Janeiro: 1a edição,


Referências

31.
R Core Team. R: A Language and Environment for Statistical Computing. Vienna, Austria: R Foundation for Statistical Computing; 2023. https://www.R-project.org/.
136.
Vetter TR. Fundamentals of Research Data and Variables. Anesthesia & Analgesia. 2017;125(4):1375–1380. doi:10.1213/ane.0000000000002370
235.
Weissgerber TL, Winham SJ, Heinzen EP, et al. Reveal, Dont Conceal. Circulation. 2019;140(18):1506–1518. doi:10.1161/circulationaha.118.037777
277.
Gerring J. Mere Description. British Journal of Political Science. 2012;42(4):721–746. doi:10.1017/s0007123412000130
278.
Krasser R. explore: Simplifies Exploratory Data Analysis.; 2023. https://CRAN.R-project.org/package=explore.
279.
Petersen AH, Ekstrøm CT. dataMaid: Your Assistant for Documenting Supervised Data Quality Screening in R. Journal of Statistical Software. 2019;90. doi:10.18637/jss.v090.i06
280.
Cui B. DataExplorer: Automate Data Exploration and Treatment.; 2020. https://CRAN.R-project.org/package=DataExplorer.
281.
Dayanand Ubrangala, R K, Prasad Kondapalli R, Putatunda S. SmartEDA: Summarize and Explore the Data.; 2022. https://CRAN.R-project.org/package=SmartEDA.
282.
Meyer F, Perrier V. esquisse: Explore and Visualize Your Data Interactively.; 2022. https://CRAN.R-project.org/package=esquisse.
283.
Cummings P, Rivara FP. Reporting Statistical Information in Medical Journal Articles. Archives of Pediatrics & Adolescent Medicine. 2003;157(4):321. doi:10.1001/archpedi.157.4.321
284.
Cole TJ. Setting number of decimal places for reporting risk ratios: rule of four. BMJ. 2015;350(apr27 3):h1845–h1845. doi:10.1136/bmj.h1845
285.
Cole TJ. Too many digits: the presentation of numerical data. Archives of Disease in Childhood. 2015;100(7):608–609. doi:10.1136/archdischild-2014-307149