Capítulo 9 Tabulação de dados


9.1 Planilhas eletrônicas


9.1.1 Qual a organização de uma tabela de dados?

  • As informações podem ser organizadas em formato de dados retangulares (ex.: matrizes, tabelas, quadro de dados) ou não retangulares (ex.: listas).REF?

  • Cada variável possui sua própria coluna (vertical).83

  • Cada observação possui sua própria linha (horizontal).83

  • Cada valor possui sua própria célula especificada em um par (linha, coluna).83

  • Cada célula possui seu próprio dado.83



9.1.2 Qual a estrutura básica de uma tabela para análise estatística?

  • Use apenas 1 (uma) planilha eletrônica para conter todas as informações coletadas. Evite múltiplas abas no mesmo arquivo, assim como múltiplos arquivos quando possível.85

  • Use apenas 1 (uma) linha de cabeçalho para nomear os fatores e variáveis do seu estudo.85

  • Tipicamente, cada linha representa um participante e cada coluna representa uma variável ou fator do estudo. Estudos com medidas repetidas dos participantes podem conter múltiplas linhas para o mesmo participante (repetindo os dados na mesma coluna, conhecido como formato curto) ou só uma linha para o participante (repetindo os dados em colunas separadas, conhecido como formato longo ).86


Tabela 9.1: Estrutura básica de uma tabela de dados.
V1 V2 V3 V4
\(x_{1,1}\) \(x_{1,2}\) \(x_{1,3}\) \(x_{1,4}\)
\(x_{2,1}\) \(x_{2,2}\) \(x_{2,3}\) \(x_{2,4}\)
\(x_{3,1}\) \(x_{3,2}\) \(x_{3,3}\) \(x_{3,4}\)
\(x_{4,1}\) \(x_{4,2}\) \(x_{4,3}\) \(x_{4,4}\)
\(x_{5,1}\) \(x_{5,2}\) \(x_{5,3}\) \(x_{5,4}\)


9.1.3 O que usar para organizar tabelas para análise computadorizada?

  • Seja consistente em: códigos para as variáveis categóricas; códigos para dados perdidos; nomes das variáveis; identificadores de participantes; nome dos arquivos; formato de datas; uso de caracteres de espaço.85,86

  • Crie um dicionário de dados (metadados) em um arquivo separado contendo: nome da variável, descrição da variável, unidades de medida e valores extremos possíveis.85

  • Use recursos para validação de dados antes e durante a digitação de dados.85,86



9.1.4 O que não usar para organizar tabelas para análise computadorizada?

  • Não deixe células em branco: substitua dados perdidos por um código sistemático (ex.: NA [not available]).85

  • Não inclua análises estatísticas ou gráficos nas tabelas de dados brutos.85

  • Não utilize cores como informação. Se necessário, crie colunas adicionais - variáveis instrumentais ou auxiliares - para identificar a informação de modo que possa ser analisada.85

  • Não use células mescladas.

  • Delete linhas e/ou colunas totalmente em branco (sem unidades de análise e/ou sem variáveis).


9.1.5 O que é recomendado e o que deve ser evitado na organização das tabelas para análise?

Tabela 9.2: Formatação recomendada para tabela de dados.
ID Data.Coleta Estado.Civil Numero.Filhos
1 08-07-2025 casado NA
2 09-07-2025 casado 1
3 10-07-2025 casado NA
4 11-07-2025 solteiro NA
5 12-07-2025 casado NA
6 13-07-2025 solteiro 0
7 14-07-2025 solteiro NA
8 15-07-2025 solteiro NA
9 16-07-2025 casado NA
10 17-07-2025 solteiro NA


Tabela 9.3: Formatação não recomendada para tabela de dados.
ID Data de Coleta Estado Civil Número de Filhos
1 08-07-2025 casado NA
2 09-07-2025 Casado 1
3 10-07-2025 casado NaN
4 11-07-2025 Solteiro N/A
5 12-07-2025 Casado N.A.
6 13-07-2025 solteiro 0
7 14-07-2025 solteiro
8 15-07-2025 Solteiro na
9 16-07-2025 casado n.a.
10 17-07-2025 Solteiro 999



Citar como:
Ferreira, Arthur de Sá. Ciência com R: Perguntas e respostas para pesquisadores e analistas de dados. Rio de Janeiro: 1a edição,


Referências

83.
Tierney N, Cook D. Expanding Tidy Data Principles to Facilitate Missing Data Exploration, Visualization and Assessment of Imputations. Journal of Statistical Software. 2023;105(7). doi:10.18637/jss.v105.i07
84.
Hammill D. DataEditR: An Interactive Editor for Viewing, Entering, Filtering & Editing Data.; 2022. https://CRAN.R-project.org/package=DataEditR.
85.
Broman KW, Woo KH. Data Organization in Spreadsheets. The American Statistician. 2018;72(1):2-10. doi:10.1080/00031305.2017.1375989
86.
Juluru K, Eng J. Use of Spreadsheets for Research Data Collection and Preparation: Academic Radiology. 2015;22(12):1592-1599. doi:10.1016/j.acra.2015.08.024
87.
Dowle M, Srinivasan A. Data.table: Extension of ‘Data.frame‘.; 2023. https://CRAN.R-project.org/package=data.table.