Capítulo 11 Tabulação de dados
11.1 Planilhas eletrônicas
11.1.1 Qual a organização de uma tabela de dados?
As informações podem ser organizadas em formato de dados retangulares (ex.: matrizes, tabelas, quadro de dados) ou não retangulares (ex.: listas).REF?
Cada variável possui sua própria coluna (vertical).99
Cada observação possui sua própria linha (horizontal).99
Cada valor possui sua própria célula especificada em um par (linha, coluna).99
Cada célula possui seu próprio dado.99
O pacote DataEditR100 fornece a função data_edit para interativamente criar, editar e salvar a tabela de dados.
11.1.2 Qual a estrutura básica de uma tabela para análise estatística?
Use apenas 1 (uma) planilha eletrônica para conter todas as informações coletadas. Evite múltiplas abas no mesmo arquivo, assim como múltiplos arquivos quando possível.101
Use apenas 1 (uma) linha de cabeçalho para nomear os fatores e variáveis do seu estudo.101
Tipicamente, cada linha representa um participante e cada coluna representa uma variável ou fator do estudo. Estudos com medidas repetidas dos participantes podem conter múltiplas linhas para o mesmo participante (repetindo os dados na mesma coluna, conhecido como formato curto) ou só uma linha para o participante (repetindo os dados em colunas separadas, conhecido como formato longo ).102
V1 | V2 | V3 | V4 |
---|---|---|---|
\(x_{1,1}\) | \(x_{1,2}\) | \(x_{1,3}\) | \(x_{1,4}\) |
\(x_{2,1}\) | \(x_{2,2}\) | \(x_{2,3}\) | \(x_{2,4}\) |
\(x_{3,1}\) | \(x_{3,2}\) | \(x_{3,3}\) | \(x_{3,4}\) |
\(x_{4,1}\) | \(x_{4,2}\) | \(x_{4,3}\) | \(x_{4,4}\) |
\(x_{5,1}\) | \(x_{5,2}\) | \(x_{5,3}\) | \(x_{5,4}\) |
11.1.3 O que usar para organizar tabelas para análise computadorizada?
Seja consistente em: códigos para as variáveis categóricas; códigos para dados perdidos; nomes das variáveis; identificadores de participantes; nome dos arquivos; formato de datas; uso de caracteres de espaço.101,102
Crie um dicionário de dados (metadados) em um arquivo separado contendo: nome da variável, descrição da variável, unidades de medida e valores extremos possíveis.101
Use recursos para validação de dados antes e durante a digitação de dados.101,102
O pacote data.table103 fornece a função melt.data.table para reorganizar a tabela em diferentes formatos.
11.1.4 O que não usar para organizar tabelas para análise computadorizada?
Não deixe células em branco: substitua dados perdidos por um código sistemático (ex.: NA [not available]).101
Não inclua análises estatísticas ou gráficos nas tabelas de dados brutos.101
Não utilize cores como informação. Se necessário, crie colunas adicionais - variáveis instrumentais ou auxiliares - para identificar a informação de modo que possa ser analisada.101
Não use células mescladas.
Delete linhas e/ou colunas totalmente em branco (sem unidades de análise e/ou sem variáveis).
11.1.5 O que é recomendado e o que deve ser evitado na organização das tabelas para análise?
ID | Data.Coleta | Estado.Civil | Numero.Filhos |
---|---|---|---|
1 | 15-02-2025 | casado | NA |
2 | 16-02-2025 | casado | 1 |
3 | 17-02-2025 | casado | NA |
4 | 18-02-2025 | solteiro | NA |
5 | 19-02-2025 | casado | NA |
6 | 20-02-2025 | solteiro | 0 |
7 | 21-02-2025 | solteiro | NA |
8 | 22-02-2025 | solteiro | NA |
9 | 23-02-2025 | casado | NA |
10 | 24-02-2025 | solteiro | NA |
ID | Data de Coleta | Estado Civil | Número de Filhos |
---|---|---|---|
1 | 15-02-2025 | casado | NA |
2 | 16-02-2025 | Casado | 1 |
3 | 17-02-2025 | casado | NaN |
4 | 18-02-2025 | Solteiro | N/A |
5 | 19-02-2025 | Casado | N.A. |
6 | 20-02-2025 | solteiro | 0 |
7 | 21-02-2025 | solteiro | |
8 | 22-02-2025 | Solteiro | na |
9 | 23-02-2025 | casado | n.a. |
10 | 24-02-2025 | Solteiro | 999 |