Capítulo 14 Tabulação de dados
14.1 Planilhas eletrônicas
14.1.1 Qual a organização de uma tabela de dados?
As informações podem ser organizadas em formato de dados retangulares (ex.: matrizes, tabelas, quadro de dados) ou não retangulares (ex.: listas).REF?
Cada variável possui sua própria coluna (vertical).147
Cada observação possui sua própria linha (horizontal).147
Cada valor possui sua própria célula especificada em um par (linha, coluna).147
Cada célula possui seu próprio dado.147
O pacote DataEditR148 fornece a função data_edit para interativamente criar, editar e salvar a tabela de dados.
14.1.2 Qual a estrutura básica de uma tabela para análise estatística?
Use apenas 1 (uma) planilha eletrônica para conter todas as informações coletadas. Evite múltiplas abas no mesmo arquivo, assim como múltiplos arquivos quando possível.149
Use apenas 1 (uma) linha de cabeçalho para nomear os fatores e variáveis do seu estudo.149
Tipicamente, cada linha representa um participante e cada coluna representa uma variável ou fator do estudo. Estudos com medidas repetidas dos participantes podem conter múltiplas linhas para o mesmo participante (repetindo os dados na mesma coluna, conhecido como formato curto) ou só uma linha para o participante (repetindo os dados em colunas separadas, conhecido como formato longo ).150
V1 | V2 | V3 | V4 |
---|---|---|---|
\(x_{1,1}\) | \(x_{1,2}\) | \(x_{1,3}\) | \(x_{1,4}\) |
\(x_{2,1}\) | \(x_{2,2}\) | \(x_{2,3}\) | \(x_{2,4}\) |
\(x_{3,1}\) | \(x_{3,2}\) | \(x_{3,3}\) | \(x_{3,4}\) |
\(x_{4,1}\) | \(x_{4,2}\) | \(x_{4,3}\) | \(x_{4,4}\) |
\(x_{5,1}\) | \(x_{5,2}\) | \(x_{5,3}\) | \(x_{5,4}\) |
14.1.3 O que usar para organizar tabelas para análise computadorizada?
Seja consistente em: códigos para as variáveis categóricas; códigos para dados perdidos; nomes das variáveis; identificadores de participantes; nome dos arquivos; formato de datas; uso de caracteres de espaço.149,150
Crie um dicionário de dados (metadados) em um arquivo separado contendo: nome da variável, descrição da variável, unidades de medida e valores extremos possíveis.149
Use recursos para validação de dados antes e durante a digitação de dados.149,150
O pacote data.table151 fornece a função melt.data.table para reorganizar a tabela em diferentes formatos.
14.1.4 O que não usar para organizar tabelas para análise computadorizada?
Não deixe células em branco: substitua dados perdidos por um código sistemático (ex.: NA [not available]).149
Não inclua análises estatísticas ou gráficos nas tabelas de dados brutos.149
Não utilize cores como informação. Se necessário, crie colunas adicionais - variáveis instrumentais ou auxiliares - para identificar a informação de modo que possa ser analisada.149
Não use células mescladas.
Delete linhas e/ou colunas totalmente em branco (sem unidades de análise e/ou sem variáveis).
14.1.5 O que é recomendado e o que deve ser evitado na organização das tabelas para análise?
ID | Data.Coleta | Estado.Civil | Numero.Filhos |
---|---|---|---|
1 | 09-09-2025 | casado | NA |
2 | 10-09-2025 | casado | 1 |
3 | 11-09-2025 | casado | NA |
4 | 12-09-2025 | solteiro | NA |
5 | 13-09-2025 | casado | NA |
6 | 14-09-2025 | solteiro | 0 |
7 | 15-09-2025 | solteiro | NA |
8 | 16-09-2025 | solteiro | NA |
9 | 17-09-2025 | casado | NA |
10 | 18-09-2025 | solteiro | NA |
ID | Data de Coleta | Estado Civil | Número de Filhos |
---|---|---|---|
1 | 09-09-2025 | casado | NA |
2 | 10-09-2025 | Casado | 1 |
3 | 11-09-2025 | casado | NaN |
4 | 12-09-2025 | Solteiro | N/A |
5 | 13-09-2025 | Casado | N.A. |
6 | 14-09-2025 | solteiro | 0 |
7 | 15-09-2025 | solteiro | |
8 | 16-09-2025 | Solteiro | na |
9 | 17-09-2025 | casado | n.a. |
10 | 18-09-2025 | Solteiro | 999 |
Ferreira, Arthur de Sá. Ciência com R: Perguntas e respostas para pesquisadores e analistas de dados. Rio de Janeiro: 1a edição,