Capítulo 11 Tabulação de dados


11.1 Planilhas eletrônicas


11.1.1 Qual a organização de uma tabela de dados?

  • As informações podem ser organizadas em formato de dados retangulares (ex.: matrizes, tabelas, quadro de dados) ou não retangulares (ex.: listas).REF?

  • Cada variável possui sua própria coluna (vertical).99

  • Cada observação possui sua própria linha (horizontal).99

  • Cada valor possui sua própria célula especificada em um par (linha, coluna).99

  • Cada célula possui seu próprio dado.99



11.1.2 Qual a estrutura básica de uma tabela para análise estatística?

  • Use apenas 1 (uma) planilha eletrônica para conter todas as informações coletadas. Evite múltiplas abas no mesmo arquivo, assim como múltiplos arquivos quando possível.101

  • Use apenas 1 (uma) linha de cabeçalho para nomear os fatores e variáveis do seu estudo.101

  • Tipicamente, cada linha representa um participante e cada coluna representa uma variável ou fator do estudo. Estudos com medidas repetidas dos participantes podem conter múltiplas linhas para o mesmo participante (repetindo os dados na mesma coluna, conhecido como formato curto) ou só uma linha para o participante (repetindo os dados em colunas separadas, conhecido como formato longo ).102


Tabela 11.1: Estrutura básica de uma tabela de dados.
V1 V2 V3 V4
\(x_{1,1}\) \(x_{1,2}\) \(x_{1,3}\) \(x_{1,4}\)
\(x_{2,1}\) \(x_{2,2}\) \(x_{2,3}\) \(x_{2,4}\)
\(x_{3,1}\) \(x_{3,2}\) \(x_{3,3}\) \(x_{3,4}\)
\(x_{4,1}\) \(x_{4,2}\) \(x_{4,3}\) \(x_{4,4}\)
\(x_{5,1}\) \(x_{5,2}\) \(x_{5,3}\) \(x_{5,4}\)


11.1.3 O que usar para organizar tabelas para análise computadorizada?

  • Seja consistente em: códigos para as variáveis categóricas; códigos para dados perdidos; nomes das variáveis; identificadores de participantes; nome dos arquivos; formato de datas; uso de caracteres de espaço.101,102

  • Crie um dicionário de dados (metadados) em um arquivo separado contendo: nome da variável, descrição da variável, unidades de medida e valores extremos possíveis.101

  • Use recursos para validação de dados antes e durante a digitação de dados.101,102



11.1.4 O que não usar para organizar tabelas para análise computadorizada?

  • Não deixe células em branco: substitua dados perdidos por um código sistemático (ex.: NA [not available]).101

  • Não inclua análises estatísticas ou gráficos nas tabelas de dados brutos.101

  • Não utilize cores como informação. Se necessário, crie colunas adicionais - variáveis instrumentais ou auxiliares - para identificar a informação de modo que possa ser analisada.101

  • Não use células mescladas.

  • Delete linhas e/ou colunas totalmente em branco (sem unidades de análise e/ou sem variáveis).


11.1.5 O que é recomendado e o que deve ser evitado na organização das tabelas para análise?

Tabela 11.2: Formatação recomendada para tabela de dados.
ID Data.Coleta Estado.Civil Numero.Filhos
1 15-02-2025 casado NA
2 16-02-2025 casado 1
3 17-02-2025 casado NA
4 18-02-2025 solteiro NA
5 19-02-2025 casado NA
6 20-02-2025 solteiro 0
7 21-02-2025 solteiro NA
8 22-02-2025 solteiro NA
9 23-02-2025 casado NA
10 24-02-2025 solteiro NA


Tabela 11.3: Formatação não recomendada para tabela de dados.
ID Data de Coleta Estado Civil Número de Filhos
1 15-02-2025 casado NA
2 16-02-2025 Casado 1
3 17-02-2025 casado NaN
4 18-02-2025 Solteiro N/A
5 19-02-2025 Casado N.A.
6 20-02-2025 solteiro 0
7 21-02-2025 solteiro
8 22-02-2025 Solteiro na
9 23-02-2025 casado n.a.
10 24-02-2025 Solteiro 999


Referências

99.
Tierney N, Cook D. Expanding Tidy Data Principles to Facilitate Missing Data Exploration, Visualization and Assessment of Imputations. Journal of Statistical Software. 2023;105(7). doi:10.18637/jss.v105.i07
100.
Hammill D. DataEditR: An Interactive Editor for Viewing, Entering, Filtering & Editing Data.; 2022. https://CRAN.R-project.org/package=DataEditR.
101.
Broman KW, Woo KH. Data Organization in Spreadsheets. The American Statistician. 2018;72(1):2-10. doi:10.1080/00031305.2017.1375989
102.
Juluru K, Eng J. Use of Spreadsheets for Research Data Collection and Preparation: Academic Radiology. 2015;22(12):1592-1599. doi:10.1016/j.acra.2015.08.024
103.
Dowle M, Srinivasan A. Data.table: Extension of ‘Data.frame‘.; 2023. https://CRAN.R-project.org/package=data.table.