Capítulo 20 Análise descritiva

20.1 Análise descritiva

20.1.1 O que é análise descritiva?

Análise descritiva é usada para compreendermos algum aspecto de um conjunto de dados, respondendo a perguntas do tipo “quando?”, “onde?”, “quem?”, “o quê?”, “como?” e “e daí?”.^111,208

O pacote base⁵⁷ fornece a função summary para calcular diversos parâmetros descritivos.

20.1.2 Como apresentar os resultados descritivos?

Variáveis categóricas: Reporte valores de frequência absoluta e relativa (n, percentual).²⁰⁹
Organização das tabelas: as variáveis são exibidas em linhas e os grupos são exibidos em colunas.²⁰⁹
Calcule percentagens para as colunas (isto é, entre grupos) e não entre linhas.²⁰⁹
Em caso de dados perdidos, não inclua uma linha com total de dados perdidos, pois distorce as proporções entre colunas e as análises de tabela de contingência. Indique no texto ou em uma coluna separada o total de dados perdidos por variável.²⁰⁹

20.2 Apresentação de resultados numéricos

20.2.1 O que são casas decimais?

O número de casas decimais refere-se à quantidade de dígitos que aparecem após a vírgula decimal.^210,211
Para tamanhos de efeito: use 2–3 dígitos significativos.²¹²
Para medidas de variabilidade (desvio-padrão/erro-padrão/intervalo de confian’;cça): use 1–2 dígitos significativos.²¹²

20.2.2 O que são dígitos significativos?

O termo “dígitos significativos” é preferido a “algarismos significativos” ou “dígitos efetivos” e não se relaciona com significância estatística.^210,211
O número de dígitos significativos é a soma total de dígitos, desconsiderando a vírgula decimal e os zeros à esquerda; os zeros à direita são considerados informativos, salvo exceções.^210,211

20.2.3 Como arredondar dados numéricos?

Apresentar dados com quantidade excessiva de casas decimais pode dificultar a interpretação e induzir erroneamente uma precisão espúria.^210,211
A precisão é determinada pelo grau de arredondamento aplicado, medido em casas decimais ou dígitos significativos.^210,211

Tabela 20.1: Quantidade de casas decimais e dígitos significativos.
Valor	Casas Decimais	Dígitos Significativos
0,00789	5	0
0,0456	4	0
45,6	1	2
123,456	3	3
7890,0000	4	4

O arredondamento também introduz erros, uma vez que aumenta a imprecisão (isto é, incerteza) em torno do valor original.^210,211

Tabela 20.2: Valores originais, arredondamentos e erros de arredondamento por casas decimais.
Valor	Casas Decimais	Dígitos Significativos	2 Casas decimais [Margem de erro]	1 Casa decimal [Margem de erro]	Sem casa decimal [Margem de erro]
0,00789	5	0	0,01 [0,005, 0,015]	0,0 [-0,05, 0,05]	0 [-0,5, 0,5]
0,0456	4	0	0,05 [0,045, 0,055]	0,0 [-0,05, 0,05]	0 [-0,5, 0,5]
45,6	1	2	45,60 [45,595, 45,605]	45,6 [45,55, 45,65]	46 [45,5, 46,5]
123,456	3	3	123,46 [123,455, 123,465]	123,5 [123,45, 123,55]	123 [122,5, 123,5]
7890,0000	4	4	7890,00 [7889,995, 7890,005]	7890,0 [7889,95, 7890,05]	7890 [7889,5, 7890,5]

A regra geral é utilizar 2 ou 3 dígitos significativos para tamanhos de efeito e 1 ou 2 dígitos significativos para medidas de variabilidade.²¹¹
Regra dos 3 dígitos significativos para proporção de risco: em média, o erro de arredondamento é menor que os 0,5% exigidos, de modo que três dígitos significativos são mais precisos do que o necessário.²¹⁰
Regra dos 4 dígitos significativos para proporção de risco: divida a proporção de risco por quatro e arredonde para dois dígitos significativos e, em seguida, relate a proporção para esse número de casas decimais.²¹⁰

20.3 Tabelas

20.3.1 Por que usar tabelas?

Tabelas complementam o texto (e vice-versa), e podem apresentar os dados de modo mais acessível e informativo.²¹³

20.3.2 Que informações incluir nas tabelas?

Título ou legenda, uma síntese descritiva (geralmente por meio de parâmetros descritivos), intervalos de confiança e/ou P-valores conforme necessário para adequada interpretação.^213,214

20.3.3 Quais são os tipos de tabelas?

Tabela de frequência: apresenta a quantidade de ocorrências (frequência absoluta e relativa) de cada categoria de uma variável; usada com variáveis qualitativas ou quantitativas discretas.^REF?
Tabela de frequência agrupada: organiza dados contínuos em intervalos de classe (ex: faixas etárias) e mostra as frequências correspondentes.^REF?
Tabela de contingência (ou tabela cruzada): cruza duas variáveis categóricas, permitindo observar possíveis associações entre elas.^REF?
Tabela de medidas descritivas: resume variáveis quantitativas com estatísticas como média, mediana, desvio-padrão, mínimo, máximo e quartis.^REF?
Tabela de comparação entre grupos: apresenta médias, desvios-padrão e ocasionalmente resultados de testes de inferência estatística para comparar dois ou mais grupos.^REF?
Tabela de resultados de testes estatísticos: exibe valores de estatísticas de teste , P valores e intervalos de confiança; usada para mostrar inferências.^REF?
Tabela de regressão (ou de modelos estatísticos): mostra os coeficientes de regressão, erros padrão, intervalos de confiança e P valores para cada variável de um modelo.^REF?
Tabela de séries temporais ou longitudinais: organiza dados medidos em diferentes momentos no tempo, permitindo visualizar tendências ou variações longitudinais.^REF?

O pacote gtsummary²¹⁵ fornece a função tbl_summary para construção da ‘Tabela 1’ com dados descritivos.

O pacote table1²¹⁶ fornece a função table1 para construção de tabelas.

O pacote flextable²¹⁷ fornece as funções flextable, as_flextable e save_as_docx para criar e salvar tabelas formatadas em DOCX.

O pacote rempsyc²¹⁸ fornece a função nice_table para criar tabelas formatadas.

20.3.4 Quais são os erros mais comuns de preenchimento de tabelas?

Erros tipográficos.²¹⁹
Ausência de rótulos ou unidades nas variáveis.²¹⁹
Relatar estatísticas incorretamente, tais como rotular variáveis contínuas como porcentagens.²¹⁹
Estatísticas descritivas de tendência central (ex.: médias) relatadas sem a estatística de dispersão correspondente (ex.: desvio-padrão).²¹⁹
Desvio-padrão nulo (\(\sigma=0\)).²¹⁹
Valores porcentuais que não correspondem ao numerador dividido pelo denominador.²¹⁹

20.4 Tabela 1

20.4.1 O que é a ‘Tabela 1’?

A ‘Tabela 1’ descreve as características demográficas, sociais e clínicas da amostra, completa ou agrupada por algum fator, geralmente por meio de parâmetros de tendência central e dispersão.^220,221

20.4.2 Qual a utilidade da ‘Tabela 1’?

Descrever (conhecer) as características da amostra e dos grupos sendo comparados, quando aplicável.²²¹
Verificar aderência ao protocolo do estudo, incluindo critérios de inclusão/exclusão, tamanho da amostra e perdas amostrais.²²¹
Permitir a replicação do estudo.²²¹
Meta-analisar os dados junto a estudos similares.²²¹
Avaliar a generalização (validade externa) das conclusões do estudo.²²¹

20.4.3 O que é a falácia da ‘Tabela 1’?

Falácia da Tabela 1 ocorre pela interpretação errônea dos P-valores na comparação entre grupos, na linha de base, de um ensaio clínico aleatorizado.²²²
Não interprete P da linha de base em ensaios clínicos como “desequilíbrio” (falácia da Tabela 1). Mantenha P-valor apenas como descritivo (ou omita), enfatizando desenho e aleatorização.²¹²

20.4.4 Como construir a ‘Tabela 1’?

A Tabela 1 geralmente é utilizada para descrever as características da amostra estudada, possibilitando a análise de ameaças à validade interna e/ou externa ao estudo.^181,223

O pacote table1²¹⁶ fornece a função table1 para construção de tabelas.

O pacote gtsummary²¹⁵ fornece a função tbl_summary para construção da ‘Tabela 1’ com dados descritivos.

Tabela 20.3: Características da amostra por grupo.
Características	N	Controle N = 103¹	Intervenção N = 97¹	Valor-p²
Sexo	200			0.060
F		49 (48%)	59 (61%)
M		54 (52%)	38 (39%)
Idade	200			0.8
Média (Desvio Padrão)		61 (12)	60 (12)
Mediana [Q1, Q3]		61 [53, 69]	60 [53, 69]
IMC	200			0.2
Média (Desvio Padrão)		26.8 (3.7)	27.5 (4.0)
Mediana [Q1, Q3]		26.6 [24.5, 29.7]	27.6 [25.6, 29.9]
¹ n (%)
² Teste qui-quadrado de independência; Teste de soma de postos de Wilcoxon

20.5 Tabela 2

20.5.1 Qual a utilidade da ‘Tabela 2’?

A Tabela 2 mostra associações ajustadas multivariadas com o resultado para variáveis resumidas na Tabela 1.²²⁰

20.5.2 O que é a falácia da ‘Tabela 2’?

A Tabela 2 pode induzir ao erro de interpretação pelas estimativas de efeitos para covariáveis do modelo também serem utilizados para controlar a confusão da exposição.^220,224
Ao apresentar estimativas de efeito ajustadas para covariáveis juntamente com a estimativa de efeito ajustada para a exposição primária, a Tabela 2 sugere implicitamente que todas estas estimativas podem ser interpretadas de forma semelhante, se não de forma idêntica, como estimativa do efeito total.^220,224
A falácia da Tabela 2 pode ser evitada limitando-se a tabela a estimativas das medidas primárias do efeito de exposição nos diferentes modelos, com as covariáveis secundárias de “ajuste” relatadas em uma nota de rodapé, juntamente com a forma como foram categorizadas ou modeladas.²²⁰

Tabela 20.4: Exemplo clássico de apresentação suscetível à Falácia da ‘Tabela 2’.
Características	Sem ajuste			Ajustado
Características	OR	95% IC	Valor-p	OR	95% IC	Valor-p
Grupo
Controle	—	—		—	—
Intervenção	1.71	0.98, 3.02	0.061	1.70	0.97, 3.03	0.067
Idade				1.02	1.00, 1.05	0.087
IMC				1.05	0.97, 1.13	0.2
Abreviações: IC = Intervalo de Confiança, OR = Razão de chances

20.5.3 Como construir a ‘Tabela 2’?

A Tabela 2 pode ser utilizada para apresentar estimativas de múltiplos efeitos ajustados de um mesmo modelo estatístico.²²⁰

Tabela 20.5: Exposição (OR; 95% IC) com e sem ajuste.
Características	Sem ajuste			Ajustado
Características	OR	95% IC	Valor-p	OR	95% IC	Valor-p
Grupo
Controle	—	—		—	—
Intervenção	1.71	0.98, 3.02	0.061	1.70	0.97, 3.03	0.067
Abreviações: IC = Intervalo de Confiança, OR = Razão de chances
Nota. Modelo ajustado por Idade (contínua) e IMC (contínuo). Covariáveis são usadas apenas para controle de confusão e não devem ser interpretadas como efeitos causais (Falácia da Tabela 2).

O pacote table1²¹⁶ fornece a função table1 para construção de tabelas.

O pacote gtsummary²¹⁵ fornece a função tbl_summary para construção da ‘Tabela 1’ com dados descritivos.

20.6 Visualização efetiva de dados

20.6.1 Por que começar pela mensagem antes do gráfico?

A figura deve responder a uma pergunta clara (comparação? tendência? composição?) e isso orienta a escolha do tipo de gráfico, dados e anotações. Esboce a mensagem e a pergunta antes de abrir o software.²²⁵

20.6.2 Como escolher a geometria e “mostrar os dados”?

Prefira geometrias que revelem distribuição/variabilidade (pontos, boxplots, violinos) em vez de médias sozinhas. Sempre que possível, exiba os dados brutos (pontos com jitter) junto da estatística-resumo.²²⁵

Figura 20.1: Exemplo de gráfico que mostra os dados brutos junto com um resumo estatístico (média e dispersão).

20.7 Gráficos

20.7.1 O que são gráficos?

Gráficos são utilizados para apresentar dados (geralmente em grande quantidade) de modo mais intuitivo e fácil de compreender.²²⁶

20.7.2 O que torna um bom gráfico tão poderoso?

“Não há ferramenta estatística tão poderosa quanto um gráfico bem escolhido”: gráficos ajudam a explorar dados, comunicar resultados e suportar decisões de forma clara e rápida.²²⁷

20.7.3 Que elementos incluir em gráficos?

Título, eixos horizontal e vertical com respectivas unidades, escalas em intervalos representativos das variáveis, legenda com símbolos, síntese descritiva dos valores e respectiva margem de erro, conforme necessário para adequada interpretação.²²⁶

20.7.4 Para que servem as barras de erro em gráficos?

Barras de erro ajudam ao autor a apresentar as informações que descrevem os dados (por exemplo, em uma análise descritiva) ou sobre as inferências ou conclusões tomadas a partir de dados.^186,187
Barras de erro mais longas representam mais imprecisão (maiores erros), enquanto barras mais curtas representam mais precisão na estimativa.¹⁸⁷
Barras de erro descritivas geralmente apresentam a amplitude (mínimo-máximo) ou desvio-padrão.¹⁸⁷
Barras de erro inferenciais geralmente apresentam o erro-padrão ou intervalo de confiança no nível de significância \(\alpha\) pré-estabelecido.^186,187
Barras de erro com desvio-padrão são úteis para descrever a variabilidade dos dados, enquanto as barras de erro com erro padrão da média são úteis para descrever a precisão do parâmetro estimado (média) e sua relação com o tamanho da amostra.¹⁸⁶
Barras de erro com intervalo de confiança são úteis para fornecer uma estimativa da incerteza da estimativa do parâmetro populacional.¹⁸⁶
O comprimento das barras de erro sugere graficamente a imprecisão dos dados do estudo, uma vez que o valor verdadeiro da população pode estar em qualquer nível do intervalo da barra.¹⁸⁷
De modo contraintuitivo, um espaço entre as barras não garante significância, nem a sobreposição a descarta—depende do tipo de barra.¹⁸⁶
Para amostras pequenas é preferível apresentar os dados brutos, uma vez que as barras de erro não serão muito informativas.¹⁸⁶

Figura 20.2: Exemplos de gráficos com barras de erro e dados brutos.

Figura 20.3: Exemplos de gráficos com barras de erro e dados brutos em diferentes cenários.

Os pacotes ggplot2¹⁷⁷, plotly²²⁸ e corrplot²²⁹ fornecem diversas funções para construção de gráficos tais como ggplot, plot_ly e corrplot respectivamente.

20.7.5 Quais são os principais obstáculos para bons gráficos?

Dificuldade técnica, negligência no ensino tradicional e o foco em “beleza” sem clareza podem levar a gráficos ruins, mesmo quando bem intencionados.²²⁷

20.8 Tipos de gráficos

20.8.1 Quais são os tipos de gráficos para variáveis categóricas?

Gráfico de barras: Mais usado para comparar frequências absolutas ou relativas entre categorias.^REF?

Figura 20.4: Gráfico de barras simples representando frequências por categoria.

Gráfico de barras empilhadas: Útil para comparar proporções entre grupos em mais de uma variável categórica.^REF?

Figura 20.5: Gráfico de barras empilhadas representando frequências por categoria.

Figura 20.6: Gráficos de barras represetando médias, barras de erro e dados individuais.

20.8.2 Quais são os tipos de gráficos para variáveis numéricas?

Histograma: Distribuição de frequência de uma variável contínua. Mostra a forma da distribuição (simétrica, assimétrica, bimodal).^REF?

Figura 20.7: Histograma da variável ‘valor’.

Gráfico de densidade: Similar ao histograma, mas mais suave. Útil para avaliar a distribuição.^REF?

Figura 20.8: Gráfico de densidade da variável ‘valor’.

Diagrama de caixa (boxplot): Resume mediana, quartis e valores extremos. Excelente para comparar grupos.^REF?

Figura 20.9: Boxplot por grupo.

Gráfico de violino: Combina boxplot e densidade, mostrando a distribuição da variável. Útil para comparar grupos.^REF?

Figura 20.10: Violin plot por grupo.

Gráfico de pontos (dot plot): Mostra cada valor individualmente, útil para pequenas amostras e para visualizar a distribuição.^REF?

Figura 20.11: Gráfico de pontos da variável ‘valor’.

20.8.3 Quais são os tipos de gráficos para relações entre variáveis?

Gráfico de dispersão (scatter plot): Mostra a relação entre duas variáveis quantitativas. Ideal para investigar correlações.^REF?

Figura 20.12: Gráfico de dispersão representando a relação entre duas variáveis.

Gráfico de bolhas (bubble chart): Expande o gráfico de dispersão adicionando uma terceira variável (tamanho da bolha).^REF?

Figura 20.13: Gráfico de bolhas representando a relação entre três variáveis.

Gr;afico Sankey: Visualiza fluxos entre categorias em diferentes etapas ou grupos. Útil para mostrar proporções e transições.^REF?

Figura 20.14: Sankey plot representando fluxos entre categorias.

Grágfico de parcats: Mostra relações entre múltiplas variáveis categóricas em paralelo. Útil para visualizar fluxos e proporções.^REF?

Figura 20.15: Gráfico de categorias paralelas (parcats) representando transições entre categorias ao longo do tempo.

Gráfico de parts: Mostra a composição percentual de uma variável categórica. Útil para visualizar proporções.^REF?

Figura 20.16: Gráfico de pares representando correlações entre múltiplas variáveis.

20.8.4 Quais são os tipos de gráficos para dados longitudinais?

Gráfico de spaghetti: Mostra trajetórias individuais ao longo do tempo, útil para dados longitudinais.^REF?

Figura 20.17: Gráfico spaghetti representando dados longitudinais.

20.8.5 Quais são os tipos de gráficos para séries temporais?

Gráfico de linhas: Mostra a evolução de uma variável ao longo do tempo, com pontos conectados por linhas.^REF?

Figura 20.18: Gráfico de linha representando uma série temporal.

20.8.6 Quais são os tipos de gráficos para dados multivariados?

Gráfico de dispersão: Representa a relação entre duas variáveis, com pontos e uma linha de tendência.^REF?

Figura 20.19: Gráfico de correlação entre duas variáveis com linha de tendência.

Gráfico de matriz de dispersão: Mostra relações entre múltiplas variáveis quantitativas, útil para identificar padrões.^REF?

Figura 20.20: Matriz de dispersão representando relações entre múltiplas variáveis.

Gráfico de calor (heatmap): Representa dados em uma matriz, com cores indicando intensidade ou frequência.^REF?

Figura 20.21: Mapa de calor da correlação entre variáveis.

Gráfico de radar (ou gráfico de aranha): Representa várias variáveis em um único gráfico, útil para comparar perfis.^REF?

Figura 20.22: Gráfico radar representando múltiplas variáveis.

20.8.7 Quais são as boas práticas na elaboração de gráficos?

O tamanho da amostra total e subgrupos, se houver, deve estar descrito na figura ou na sua legenda.¹⁸⁷
Para análise inferencial de figuras, as barras de erro representadas por erro-padrão ou intervalo de confiança no nível de significância \(\alpha\) pré-estabelecido são preferíveis à amplitude ou desvio-padrão.^186,187
Evite gráficos de barra e mostre a distribuição dos dados sempre que possível.²¹²
Exiba os pontos de dados em boxplots.²¹²
Use jitter simétrico em gráficos de pontos para permitir a visualização de todos os dados.²¹²
Prefira palhetas de cor adaptadas para daltônicos.²¹²
Uma boa legenda torna a figura autossuficiente: descreva amostra (n), geometrias, métricas de incerteza, escalas/unidades e mensagem principal. Se houver modelo, indique fórmula/ajustes em nota.²²⁵
Evite gráficos de barras com médias para variáveis contínuas; prefira pontos/box/violino e, em amostras pequenas, exiba todos os dados.²¹²
Antes de finalizar um gráfico, faça as seguintes perguntas: (1) Mensagem está explícita? (2) Geometria adequada e dados visíveis? (3) Incerteza correta e rotulada? (4) Cores informativas e acessíveis? (5) Escalas comparáveis (se facetou)? (6) Legenda/caption autossuficiente? (7) Diferença clara entre dados e modelos? (8) Arquivo exportado na resolução/tamanho exigidos?²²⁵

O pacote ggsci²³⁰ fornece palhetas de cores tais como pal_lancet, pal_nejm e pal_npg inspiradas em publicações científicas para uso em gráficos.

O pacote grDevices¹⁷⁶ fornece a função dev.new para controlar diversos aspectos do gráfico, tais como tamanho e resolução.

O pacote tiff²³¹ fornece a função writeTIFF para exportar gráficos em formato TIFF.

20.9 Gráficos dinâmicos

20.9.1 O que são visualizações dinâmicas?

Visualizações dinâmicas combinam interatividade (exploração ativa pelo leitor) e animação (mudanças ao longo do tempo/iterações) para empacotar informação rica em exibições simples, tornando comunicação e exploração mais transparentes.²³²

20.9.2 Quando preferir interatividade?

Durante exploração de dados em equipe: destacar pontos/linhas por participante, filtrar subconjuntos e inspecionar impactos de escolhas analíticas (p.ex., outliers) sem gerar múltiplas figuras novas.²³²

Figura 20.23: Exemplo de gráfico interativo com Plotly.

O pacote plotly²²⁸ fornece a função plot_ly para gerar gráficos interativos.

20.9.3 Quando preferir animação?

Em apresentações e para ilustrar variação ao longo de tempo/condição/algoritmo, evitando painéis 3D ou facets excessivos. A animação guia a atenção e revela mudanças de forma passiva e fluida.²³²

O pacote gganimate²³³ fornece a função transition_states para criar gráficos animados a partir de gráficos estáticos do ggplot2¹⁷⁷.

Citar como:
Ferreira, Arthur de Sá. Ciência com R: Perguntas e respostas para pesquisadores e analistas de dados. Rio de Janeiro: 1a edição,

Referências

57.

R Core Team. R: A Language and Environment for Statistical Computing. Vienna, Austria: R Foundation for Statistical Computing; 2023. https://www.R-project.org/.

111.

Vetter TR. Fundamentals of Research Data and Variables. Anesthesia & Analgesia. 2017;125(4):1375–1380. doi:10.1213/ane.0000000000002370

176.

R Core Team. R: A Language and Environment for Statistical Computing.; 2023. https://www.R-project.org/.

177.

Wickham H. ggplot2: Elegant Graphics for Data Analysis. Springer; 2016. https://ggplot2.tidyverse.org.

181.

Greenhalgh T. How to read a paper: Statistics for the non-statistician. I: Different types of data need different statistical tests. BMJ. 1997;315(7104):364–366. doi:10.1136/bmj.315.7104.364

186.

Krzywinski M, Altman N. Error bars. Nature Methods. 2013;10(10):921–922. doi:10.1038/nmeth.2659

187.

Cumming G, Fidler F, Vaux DL. Error bars in experimental biology. The Journal of Cell Biology. 2007;177(1):7–11. doi:10.1083/jcb.200611141

208.

Gerring J. Mere Description. British Journal of Political Science. 2012;42(4):721–746. doi:10.1017/s0007123412000130

209.

Cummings P, Rivara FP. Reporting Statistical Information in Medical Journal Articles. Archives of Pediatrics & Adolescent Medicine. 2003;157(4):321. doi:10.1001/archpedi.157.4.321

210.

Cole TJ. Setting number of decimal places for reporting risk ratios: rule of four. BMJ. 2015;350(apr27 3):h1845–h1845. doi:10.1136/bmj.h1845

211.

Cole TJ. Too many digits: the presentation of numerical data. Archives of Disease in Childhood. 2015;100(7):608–609. doi:10.1136/archdischild-2014-307149

212.

Weissgerber TL, Winham SJ, Heinzen EP, et al. Reveal, Don’t Conceal. Circulation. 2019;140(18):1506–1518. doi:10.1161/circulationaha.118.037777

213.

Inskip H, Ntani G, Westbury L, et al. Getting started with tables. Archives of Public Health. 2017;75(1). doi:10.1186/s13690-017-0180-1

214.

Kwak SG, Kang H, Kim JH, et al. The principles of presenting statistical results: Table. Korean Journal of Anesthesiology. 2021;74(2):115–119. doi:10.4097/kja.20582

215.

Sjoberg DD, Whiting K, Curry M, Lavery JA, Larmarange J. Reproducible Summary Tables with the gtsummary Package. The R Journal. 2021;13:570–580. doi:10.32614/RJ-2021-053

216.

Rich B. table1: Tables of Descriptive Statistics in HTML.; 2023. https://CRAN.R-project.org/package=table1.

217.

Gohel D, Skintzos P. flextable: Functions for Tabular Reporting.; 2023. https://CRAN.R-project.org/package=flextable.

218.

Thériault R. rempsyc: Convenience functions for psychology. Journal of Open Source Software. 2023;8:5466. doi:10.21105/joss.05466

219.

Barnett A. Automated detection of over- and under-dispersion in baseline tables in randomised controlled trials. F1000Research. 2023;11:783. doi:10.12688/f1000research.123002.2

220.

Westreich D, Greenland S. The Table 2 Fallacy: Presenting and Interpreting Confounder and Modifier Coefficients. American Journal of Epidemiology. 2013;177(4):292–298. doi:10.1093/aje/kws412

221.

Chen H, Lu Y, Slye N. Testing for baseline differences in clinical trials. International Journal of Clinical Trials. 2020;7(2):150. doi:10.18203/2349-3259.ijct20201720

222.

Pijls BG. The Table I Fallacy: P Values in Baseline Tables of Randomized Controlled Trials. Journal of Bone and Joint Surgery. 2022;104(16):e71. doi:10.2106/jbjs.21.01166

223.

Hayes-Larson E, Kezios KL, Mooney SJ, Lovasi G. Who is in this study, anyway? Guidelines for a useful Table 1. Journal of Clinical Epidemiology. 2019;114:125–132. doi:10.1016/j.jclinepi.2019.06.011

224.

Bandoli G, Palmsten K, Chambers CD, Jelliffe-Pawlowski LL, Baer RJ, Thompson CA. Revisiting the Table 2 fallacy: A motivating example examining preeclampsia and preterm birth. Paediatric and Perinatal Epidemiology. 2018;32(4):390–397. doi:10.1111/ppe.12474

225.

Midway SR. Principles of Effective Data Visualization. Patterns. 2020;1(9):100141. doi:10.1016/j.patter.2020.100141

226.

Park JH, Lee DK, Kang H, et al. The principles of presenting statistical results using figures. Korean Journal of Anesthesiology. 2022;75(2):139–150. doi:10.4097/kja.21508

227.

Vandemeulebroecke M, Baillie M, Carr D, et al. How can we make better graphs? An initiative to increase the graphical expertise and productivity of quantitative scientists. Pharmaceutical Statistics. 2018;18(1):106–114. doi:10.1002/pst.1912

228.

Sievert C. Interactive Web-Based Data Visualization with R, plotly, and shiny. Chapman; Hall/CRC; 2020. https://plotly-r.com.

229.

Wei T, Simko V. R package corrplot: Visualization of a Correlation Matrix.; 2024. https://github.com/taiyun/corrplot.

230.

Xiao N. ggsci: Scientific Journal and Sci-Fi Themed Color Palettes for ggplot2.; 2023. https://CRAN.R-project.org/package=ggsci.

231.

Urbanek S, Johnson K. tiff: Read and Write TIFF Images.; 2022. https://CRAN.R-project.org/package=tiff.

232.

Wiebels K, Moreau D. Dynamic Data Visualizations to Enhance Insight and Communication Across the Life Cycle of a Scientific Project. Advances in Methods and Practices in Psychological Science. 2023;6(3). doi:10.1177/25152459231160103

233.

Pedersen TL, Robinson D. gganimate: A Grammar of Animated Graphics.; 2025. doi:10.32614/CRAN.package.gganimate