Capítulo 14 Tabulação de dados
14.1 Planilhas eletrônicas
14.1.1 Qual a organização de uma tabela de dados?
Cada variável possui sua própria coluna (vertical).176
Cada observação possui sua própria linha (horizontal).176
Cada valor possui sua própria célula especificada em um par (linha, coluna).176
Cada célula possui seu próprio dado.176
O pacote DataEditR177 fornece a função data_edit para interativamente criar, editar e salvar a tabela de dados.
14.1.2 Qual a estrutura básica de uma tabela para análise estatística?
Use apenas 1 (uma) planilha eletrônica para conter todas as informações coletadas.178
Evite múltiplas abas no mesmo arquivo, assim como múltiplos arquivos quando possível.178
Use apenas 1 (uma) linha de cabeçalho para nomear os fatores e variáveis do seu estudo.178
| V1 | V2 | V3 | V4 |
|---|---|---|---|
| \(x_{1,1}\) | \(x_{1,2}\) | \(x_{1,3}\) | \(x_{1,4}\) |
| \(x_{2,1}\) | \(x_{2,2}\) | \(x_{2,3}\) | \(x_{2,4}\) |
| \(x_{3,1}\) | \(x_{3,2}\) | \(x_{3,3}\) | \(x_{3,4}\) |
| \(x_{4,1}\) | \(x_{4,2}\) | \(x_{4,3}\) | \(x_{4,4}\) |
| \(x_{5,1}\) | \(x_{5,2}\) | \(x_{5,3}\) | \(x_{5,4}\) |
Cada linha representa um participante e cada coluna representa uma variável ou fator do estudo.179
Estudos com medidas repetidas dos participantes podem conter múltiplas linhas para o mesmo participante (repetindo os dados na mesma coluna), conhecido como formato curto.179
Estudos com medidas repetidas dos participantes podem conter só uma linha para o participante (repetindo os dados em colunas separadas), conhecido como formato longo.179
| Linha | Variavel | Valor |
|---|---|---|
| 1 | V1 | \(x_{1,1}\) |
| 1 | V2 | \(x_{1,2}\) |
| 1 | V3 | \(x_{1,3}\) |
| 1 | V4 | \(x_{1,4}\) |
| 2 | V1 | \(x_{2,1}\) |
| 2 | V2 | \(x_{2,2}\) |
| 2 | V3 | \(x_{2,3}\) |
| 2 | V4 | \(x_{2,4}\) |
| 3 | V1 | \(x_{3,1}\) |
| 3 | V2 | \(x_{3,2}\) |
| 3 | V3 | \(x_{3,3}\) |
| 3 | V4 | \(x_{3,4}\) |
| 4 | V1 | \(x_{4,1}\) |
| 4 | V2 | \(x_{4,2}\) |
| 4 | V3 | \(x_{4,3}\) |
| 4 | V4 | \(x_{4,4}\) |
| 5 | V1 | \(x_{5,1}\) |
| 5 | V2 | \(x_{5,2}\) |
| 5 | V3 | \(x_{5,3}\) |
| 5 | V4 | \(x_{5,4}\) |
| id | T1 | T2 | T3 | T4 |
|---|---|---|---|---|
| 1 | \(x_{1,T1}\) | \(x_{1,T2}\) | \(x_{1,T3}\) | \(x_{1,T4}\) |
| 2 | \(x_{2,T1}\) | \(x_{2,T2}\) | \(x_{2,T3}\) | \(x_{2,T4}\) |
| 3 | \(x_{3,T1}\) | \(x_{3,T2}\) | \(x_{3,T3}\) | \(x_{3,T4}\) |
| 4 | \(x_{4,T1}\) | \(x_{4,T2}\) | \(x_{4,T3}\) | \(x_{4,T4}\) |
| 5 | \(x_{5,T1}\) | \(x_{5,T2}\) | \(x_{5,T3}\) | \(x_{5,T4}\) |
14.1.3 O que usar para organizar tabelas para análise computadorizada?
Seja consistente em: códigos para as variáveis categóricas; códigos para dados perdidos; nomes das variáveis; identificadores de participantes; nome dos arquivos; formato de datas; uso de caracteres de espaço.178,179
Crie um dicionário de dados (metadados) em um arquivo separado contendo: nome da variável, descrição da variável, unidades de medida e valores extremos possíveis.178
Use recursos para validação de dados antes e durante a digitação de dados.178,179
O pacote data.table180 fornece a função melt.data.table para reorganizar a tabela em diferentes formatos.
14.1.4 O que não usar para organizar tabelas para análise computadorizada?
Não deixe células em branco: substitua dados perdidos por um código sistemático (ex.: NA [not available]).178
Não inclua análises estatísticas ou gráficos nas tabelas de dados brutos.178
Não utilize cores como informação. Se necessário, crie colunas adicionais — variáveis instrumentais ou auxiliares — para identificar a informação de modo que possa ser analisada.178
Não use células mescladas.
Delete linhas e/ou colunas totalmente em branco (sem unidades de análise e/ou sem variáveis).
14.1.5 O que é recomendado e o que deve ser evitado na organização das tabelas para análise?
| ID | Data.Coleta | Estado.Civil | Numero.Filhos |
|---|---|---|---|
| 1 | 02-07-2026 | casado | NA |
| 2 | 03-07-2026 | casado | 1 |
| 3 | 04-07-2026 | casado | NA |
| 4 | 05-07-2026 | solteiro | NA |
| 5 | 06-07-2026 | casado | NA |
| 6 | 07-07-2026 | solteiro | 0 |
| 7 | 08-07-2026 | solteiro | NA |
| 8 | 09-07-2026 | solteiro | NA |
| 9 | 10-07-2026 | casado | NA |
| 10 | 11-07-2026 | solteiro | NA |
| ID | Data de Coleta | Estado Civil | Número de Filhos |
|---|---|---|---|
| 1 | 02-07-2026 | casado | NA |
| 2 | 03-07-2026 | Casado | 1 |
| 3 | 04-07-2026 | casado | NaN |
| 4 | 05-07-2026 | Solteiro | N/A |
| 5 | 06-07-2026 | Casado | N.A. |
| 6 | 07-07-2026 | solteiro | 0 |
| 7 | 08-07-2026 | solteiro | |
| 8 | 09-07-2026 | Solteiro | na |
| 9 | 10-07-2026 | casado | n.a. |
| 10 | 11-07-2026 | Solteiro | 999 |
Ferreira, Arthur de Sá. Ciência com R: Perguntas e respostas para pesquisadores e analistas de dados. Rio de Janeiro: 1a edição,