e-Book | Consultoria
Capa
Dedicatória
Agradecimentos
Apresentação
Sobre o autor
PARTE 1: FUNDAMENTOS ESTATÍSTICOS
1
Pensamento probabilístico
1.1
Experimento
1.1.1
O que é um experimento?
1.1.2
O que é um experimento aleatório?
1.2
Espaço amostral e eventos discretos
1.2.1
O que é espaço amostral discreto?
1.2.2
O que é evento discreto?
1.2.3
O que é espaço de eventos discretos?
1.3
Espaço amostral e eventos contínuos
1.3.1
O que é espaço amostral contínuo?
1.3.2
O que é evento contínuo?
1.3.3
O que é espaço de eventos contínuo?
1.4
Probabilidade
1.4.1
O que é probabilidade?
1.4.2
Quais são os axiomas da probabilidade?
1.5
Independência e probabilidade
1.5.1
O que é independência em estatística?
1.5.2
O que é probabilidade marginal?
1.5.3
O que é probabilidade conjunta?
1.5.4
O que é probabilidade condicional?
1.6
Leis dos números anômalos
1.6.1
O que é a lei dos números anômalos?
1.7
Leis dos pequenos números
1.7.1
O que é a lei dos pequenos números?
1.7.2
Quais são as versões da lei dos pequenos números?
1.8
Leis dos grandes números
1.8.1
O que é a lei dos grandes números?
1.8.2
Quais são as versões da lei dos grandes números?
1.9
Teorema central do limite
1.9.1
O que é teorema central do limite?
1.9.2
Quais as condições de validade do teorema central do limite?
1.9.3
Qual a relação entre a lei dos grandes números e o teorema central do limite?
1.9.4
Qual a relevância do teorema central do limite para a análise estatística?
1.10
Regressão para a média
1.10.1
O que é regressão para a média?
1.10.2
Qual a causa da regressão para a média?
1.10.3
Por que detectar o fenômeno de regressão para a média?
1.10.4
Com detectar o fenômeno de regressão para a média?
1.10.5
Como o fenômeno de regressão para a média pode ser evitado?
2
Pensamento estatístico
2.1
Unidade de análise
2.1.1
O que é unidade de análise?
2.1.2
Por que identificar a unidade de análise de um estudo?
2.1.3
Que medidas podem ser obtidas da unidade de análise de um estudo?
2.2
População
2.2.1
O que é população?
2.2.2
O que é representatividade e por que ela importa?
2.3
Amostra
2.3.1
O que é amostra?
2.3.2
Por que usar dados de amostras?
2.4
Amostragem
2.4.1
O que é amostragem?
2.4.2
Quais métodos de amostragem são usados para obter uma amostra da população?
2.4.3
O que é erro de amostragem?
2.5
Reamostragem
2.5.1
O que é reamostragem?
2.5.2
Por que utilizar reamostragem?
2.5.3
Quais procedimentos de reamostragem podem ser realizados?
2.6
Subamostragem
2.6.1
O que é subamostragem?
2.7
Superamostragem
2.7.1
O que é superamostragem?
3
Falácias estatísticas
3.1
Falácias
3.1.1
O que são falácias estatísticas?
3.1.2
O que é a falácia do jogador?
3.1.3
O que é a falácia da mão quente?
4
Paradoxos estatísticos
4.1
Paradoxos
4.1.1
O que são paradoxos estatísticos?
4.1.2
O que é o paradoxo de Abelson?
4.1.3
O que é o paradoxo de Berkson?
4.1.4
O que é o paradoxo de
Big Data
?
4.1.5
O que é o paradoxo de Ellsberg?
4.1.6
O que é o paradoxo de Freedman?
4.1.7
O que é o paradoxo de Hand?
4.1.8
O que é o paradoxo de Lindley?
4.1.9
O que é o paradoxo de Lord?
4.1.10
O que é o paradoxo de Proebsting?
4.1.11
O que é o paradoxo de Simpson?
4.1.12
O que é o paradoxo de Stein?
4.1.13
O que é o paradoxo de Okie?
4.1.14
O que é o paradoxo da acurácia?
4.1.15
O que é o paradoxo do falso positivo?
4.1.16
O que é o paradoxo da caixa de Bertrand?
4.1.17
O que é o paradoxo do elevador?
4.1.18
O que é o paradoxo da amizade?
4.1.19
O que é o paradoxo do menino ou menina?
4.1.20
O que é o paradoxo do teste surpresa?
4.1.21
O que é o paradoxo do nó da gravata?
4.1.22
O que é o paradoxo da Bela Adormecida?
5
Letramento estatístico
5.0.1
O que é letramento estatístico?
5.0.2
Por que o letramento estatístico é importante?
5.0.3
Quais são exemplos de “armadilhas” comuns na interpretação de estatísticas?
5.1
Elementos centrais do letramento estatístico
5.1.1
Quais são os elementos de conhecimento que sustentam o letramento estatístico?
5.1.2
Quais são os cinco elementos de conhecimento que sustentam o letramento estatístico?
5.1.3
Quais são os dois elementos de disposição que facilitam a ação estatisticamente letrada?
5.1.4
Que tipo de perguntas críticas (
worry questions
) devemos fazer ao interpretar informação estatística?
5.2
Hierarquia de letramento estatístico
5.2.1
Quais são os níveis da hierarquia de letramento estatístico?
5.2.2
Quais são os componentes centrais do letramento estatístico com literacia de dados?
5.3
Habilidades de letramento estatístico baseadas no pensamento crítico
5.3.1
Quais são as habilidades de letramento estatístico?
PARTE 2: FUNDAMENTOS METODOLÓGICOS
6
Pensamento metodológico
6.1
Metodologia da pesquisa
6.1.1
O que é metodologia da pesquisa?
6.2
Relação Estatística-Metodologia
6.2.1
Qual a relação entre estatística e metodologia da pesquisa?
6.3
Pré-registro
6.3.1
O que é pré-registro?
6.4
Reprodutibilidade
6.4.1
O que é reprodutibilidade?
6.4.2
Por que reprodutibilidade é importante?
6.4.3
Como contribuir para a reprodutibilidade?
6.5
Robustez
6.5.1
O que é robustez?
6.6
Replicabilidade
6.6.1
O que é replicabilidade?
6.7
Generalização
6.7.1
O que é generalização?
7
Vieses metodológicos
7.1
Vieses metodológicos
7.1.1
O que são vieses metodológicos?
7.2
Tipos de vieses metodológicos
7.2.1
Quais são os tipos de vieses metodológicos?
7.3
Efeitos relacionados aos vieses metodológicos
7.3.1
Quais são os efeitos relacionados aos vieses metodológicos?
7.3.2
O que é efeito placebo?
7.3.3
O que é efeito nocebo?
7.3.4
O que é efeito Hawthorne?
7.3.5
O que é efeito Rosenthal?
7.4
Diretrizes para redação
7.4.1
Quais são as diretrizes para redação de análises de vieses metodológicos?
8
Práticas questionáveis em pesquisa
8.1
Práticas Questionáveis em Pesquisa
8.1.1
O que são práticas questionáveis em pesquisa?
8.1.2
Por que práticas questionáveis em pesquisa devem ser combatidas?
8.2
Prática não intencional e má conduta
8.2.1
Quais práticas questionáveis podem ocorrer durante o planejamento do estudo?
8.2.2
Quais práticas questionáveis podem ocorrer durante a coleta de dados?
8.2.3
Quais práticas questionáveis podem ocorrer durante a análise dos dados?
8.2.4
Quais práticas questionáveis podem ocorrer durante a apresentação dos resultados?
8.2.5
Quais práticas questionáveis podem ocorrer durante a publicação e revisão por pares?
8.3
Prevenindo práticas questionáveis em pesquisa
8.3.1
Como prevenir práticas questionáveis?
8.4
Reações éticas e institucionais práticas questionáveis em pesquisa
PARTE 4: DO MUNDO REAL À TABELA
9
Pensamento computacional
9.1
R
9.1.1
O que é R?
9.1.2
Por que usar R?
9.1.3
O que é R Markdown?
9.1.4
Que programas de computador podem ser usados para análise estatística com R?
9.2
RStudio
9.2.1
O que é RStudio?
9.3
Scripts
9.3.1
O que são R scripts?
9.3.2
Quais são as boas práticas na redação de scripts?
9.4
Pacotes
9.4.1
O que são pacotes?
9.5
Aplicativos
9.5.1
O que são Shiny Apps?
9.6
Manuscritos reproduzíveis
9.6.1
O que são manuscritos reproduzíveis?
9.6.2
Por que usar manuscritos reproduzíveis?
9.6.3
Como manuscritos reprodutíveis contribuem para a ciência?
9.7
Compartilhamento
9.7.1
Por que compartilhar scripts?
9.7.2
O que pode ser compartilhado?
9.7.3
Como preparar dados para compartilhamento?
9.7.4
Como preparar scripts para compartilhamento?
9.7.5
O que incluir no arquivo README?
10
Simulação computacional
10.1
Simulações computacionais
10.1.1
O que são simulações computacionais?
10.1.2
Por que usar simulações?
10.1.3
Quais são as boas práticas em simulações computacionais?
10.2
Características
10.2.1
Quais são as características de estudos de simulação computacional?
10.3
Método de Monte Carlo
10.3.1
O que é o método de Monte Carlo?
10.4
Diretrizes para redação
10.4.1
Quais são as diretrizes para redação de estudos de simulação computacional?
PARTE 3: FUNDAMENTOS COMPUTACIONAIS
11
Variáveis e fatores
11.1
Variáveis
11.1.1
O que são variáveis?
11.1.2
Como são classificadas as variáveis?
11.1.3
Por que é importante classificar as variáveis?
11.2
Transformação de variáveis
11.2.1
O que é transformação de variáveis?
11.2.2
Por que transformar variáveis?
11.2.3
Quais transformações podem ser aplicadas?
11.3
Centralização de variáveis (
centering
)
11.3.1
O que é centralização?
11.3.2
Por que centralizar?
11.4
Padronização de variáveis
11.4.1
O que é padronização?
11.4.2
Por que padronizar?
11.4.3
Quais são os métodos de padronização mais comuns?
11.4.4
Quais são as boas práticas de nomenclatura ao padronizar variáveis?
11.5
Categorização de variáveis contínuas
11.5.1
O que é categorização de uma variável?
11.5.2
Por que não é recomendado categorizar variáveis contínuas?
11.5.3
Quais são as alternativas à categorização de variáveis contínuas?
11.6
Dicotomização de variáveis contínuas
11.6.1
O que são variáveis dicotômicas?
11.6.2
Quais argumentos são usados para defender a categorização ou dicotomização de variáveis contínuas?
11.6.3
Por que não é recomendado dicotomizar variáveis contínuas?
11.6.4
Quais cenários legitimam a dicotomização das variáveis contínuas?
11.6.5
Quais métodos são usados para dicotomizar variáveis contínuas?
11.7
Fatores
11.7.1
O que são fatores?
11.7.2
O que são níveis de um fator?
12
Dados,
big data
e metadados
12.1
Dados
12.1.1
O que são dados?
12.1.2
Quais são as fontes de dados?
12.1.3
O que são dados primários e secundários?
12.1.4
O que são dados quantitativos e qualitativos?
12.2
Big data
12.2.1
O que são
big data
?
12.3
Metadados
12.3.1
O que são metadados?
12.3.2
Quais são as recomendações para os metadados de um banco de dados?
13
Medidas e instrumentos
13.1
Escalas
13.1.1
O que são escalas?
13.2
Medição e Medidas
13.2.1
O que é medição?
13.2.2
O que são medidas diretas?
13.2.3
O que são medidas derivadas?
13.2.4
O que são medidas por teoria?
13.2.5
O que são medidas únicas?
13.2.6
O que são medidas repetidas?
13.2.7
O que são medidas seriadas?
13.2.8
O que são medidas múltiplas?
13.3
Erros de medida
13.3.1
O que são erros de medida?
13.3.2
Quais fontes de variabilidade são comumente investigadas?
13.4
Instrumentos
13.4.1
O que são instrumentos?
13.5
Acurácia e precisão
13.5.1
O que é acurácia?
13.5.2
O que é precisão?
13.6
Viés e variabilidade
13.6.1
Qual é a relação entre viés e variabilidade?
14
Tabulação de dados
14.1
Planilhas eletrônicas
14.1.1
Qual a organização de uma tabela de dados?
14.1.2
Qual a estrutura básica de uma tabela para análise estatística?
14.1.3
O que usar para organizar tabelas para análise computadorizada?
14.1.4
O que não usar para organizar tabelas para análise computadorizada?
14.1.5
O que é recomendado e o que deve ser evitado na organização das tabelas para análise?
15
Dados perdidos e imputados
15.1
Dados perdidos
15.1.1
O que são dados perdidos?
15.1.2
Qual o problema de um estudo ter dados perdidos?
15.1.3
Quais os mecanismos geradores de dados perdidos?
15.1.4
Como identificar o mecanismo gerador de dados perdidos em um banco de dados?
15.1.5
Que estratégias podem ser utilizadas na coleta de dados quando há expectativa de perda amostral?
15.1.6
Que estratégias podem ser utilizadas na análise quando há dados perdidos?
15.1.7
Que estratégias podem ser utilizadas na redação de estudos em que há dados perdidos?
15.2
Dados imputados
15.2.1
O que são dados imputados?
15.2.2
Quando a imputação de dados é indicada?
15.2.3
Quais os métodos de imputação de dados?
16
Dados anonimizados e sintéticos
16.1
Dados anonimizados
16.1.1
O que são dados anonimizados?
16.1.2
Com anonimizar os dados de um banco?
16.2
Dados sintéticos
16.2.1
O que são dados sintéticos?
PARTE 5: ANÁLISES DESCRITIVAS E EXPLORATÓRIAS
17
Análise inicial de dados
17.1
Análise inicial de dados
17.1.1
O que é análise inicial de dados?
17.1.2
Como conduzir uma análise inicial de dados?
17.1.3
Quais problemas podem ser detectados na análise inicial de dados?
18
Descrição
18.1
Análise de descrição
18.1.1
O que é análise de descrição de dados?
18.2
Estimação
18.2.1
O que é estimativa?
18.2.2
O que é estimativa pontual?
18.2.3
O que é estimativa intervalar?
18.2.4
O que é estimativa de parâmetro?
19
Análise exploratória de dados
19.1
Análise exploratória de dados
19.1.1
O que é análise exploratória de dados?
19.1.2
Por que conduzir a análise exploratória de dados?
19.1.3
Quais etapas constituem a análise exploratória de dados?
20
Análise descritiva
20.1
Análise descritiva
20.1.1
O que é análise descritiva?
20.1.2
Como apresentar os resultados descritivos?
20.2
Apresentação de resultados numéricos
20.2.1
O que são casas decimais?
20.2.2
O que são dígitos significativos?
20.2.3
Como arredondar dados numéricos?
20.3
Tabelas
20.3.1
Por que usar tabelas?
20.3.2
Que informações incluir nas tabelas?
20.3.3
Quais são os tipos de tabelas?
20.3.4
Quais são os erros mais comuns de preenchimento de tabelas?
20.4
Tabela 1
20.4.1
O que é a ‘Tabela 1’?
20.4.2
Qual a utilidade da ‘Tabela 1’?
20.4.3
O que é a falácia da ‘Tabela 1’?
20.4.4
Como construir a ‘Tabela 1’?
20.5
Tabela 2
20.5.1
Qual a utilidade da ‘Tabela 2’?
20.5.2
O que é a falácia da ‘Tabela 2’?
20.5.3
Como construir a ‘Tabela 2’?
20.6
Gráficos
20.6.1
O que são gráficos?
20.6.2
Quais são os tipos de gráficos para variáveis categóricas?
20.6.3
Quais são os tipos de gráficos para variáveis numéricas?
20.6.4
Quais são os tipos de gráficos para relações entre variáveis?
20.6.5
Quais são os tipos de gráficos para séries temporais?
20.6.6
Quais são os tipos de gráficos para dados multivariados?
20.6.7
Que elementos incluir em gráficos?
20.6.8
Para que servem as barras de erro em gráficos?
20.6.9
Quais são as boas práticas na elaboração de gráficos?
20.6.10
Como exportar figuras em formato TIFF?
21
Distribuições e parâmetros
21.1
Distribuições de probabilidade
21.1.1
O que são distribuições de probabilidade?
21.1.2
Como representar distribuições de probabilidade?
21.1.3
Quais características definem uma distribuição?
21.1.4
Quais são as distribuições mais comuns?
21.1.5
Quais são as funções de uma distribuição?
21.1.6
O que é a distribuição normal?
21.1.7
Que métodos podem ser utilizados para identificar a normalidade da distribuição?
21.1.8
O que são distribuições não-normais?
21.2
Parâmetros
21.2.1
O que são parâmetros?
21.2.2
O que é uma análise paramétrica?
21.2.3
O que é uma análise não paramétrica?
21.2.4
Devemos testar as suposições de normalidade?
21.2.5
Por que as análises paramétricas são preferidas?
21.2.6
Que parâmetros podem ser estimados?
21.3
Tendência central
21.3.1
Que parâmetros de tendência central podem ser estimados?
21.3.2
Como escolher o parâmetro de tendência central?
21.4
Dispersão
21.4.1
Que parâmetros de dispersão podem ser estimados?
21.4.2
Como escolher o parâmetro de dispersão?
21.4.3
O que é a correção de Bessel para variância?
21.4.4
Por que a correção de Bessel para variância é importante?
21.5
Proporção
21.5.1
Que parâmetros de proporção podem ser estimados?
21.6
Distribuição
21.6.1
Que parâmetros de distribuição podem ser estimados?
21.7
Extremos
21.7.1
O que são valores extremos?
21.7.2
Que parâmetros extremos podem ser estimados?
21.8
Robustez em medidas de localização
21.8.1
O que é ponto de quebra (
breakdown value
)?
21.8.2
Por que a média não é robusta?
21.8.3
Qual a alternativa robusta para localização?
21.8.4
Como estimar escala de forma robusta?
21.9
Parâmetros robustos
21.9.1
O que são parâmetros robustos?
21.9.2
Que parâmetros robustos podem ser estimados?
21.9.3
Por que utilizar parâmetros robustos?
22
Análise robusta
22.1
Raciocínio inferencial robusto
22.1.1
O que é análise robusta?
22.1.2
Por que usar análise robusta?
22.1.3
Quando usar análise robusta?
22.1.4
Por que métodos robustos são preferíveis?
22.2
Valores discrepantes
22.2.1
O que são valores discrepantes (
outliers
)?
22.2.2
Quais são os tipos de valores discrepantes?
22.2.3
Por que é importante avaliar valores discrepantes?
22.2.4
Como detectar valores discrepantes?
22.2.5
Quais são os métodos para detectar valores discrepantes?
22.2.6
Quais testes são apropriados para detectar valores discrepantes?
22.2.7
Como manejar os valores discrepantes?
22.2.8
Como conduzir análises com valores discrepantes?
22.3
Valores influentes
22.3.1
O que são valores influentes?
22.3.2
O que é função de influência?
22.3.3
O que é ponto de quebra?
22.3.4
Como detectar valores influentes?
22.4
Métodos robustos de tratamento de
outliers
22.4.1
O que é Winsorização?
22.4.2
Quais são as alternativas à Winsorização?
PARTE 6: ANÁLISES INFERENCIAIS
23
Seleção de testes
23.1
Multiverso de análises estatísticas
23.1.1
Por que escolher o teste é um problema?
23.2
Escolha de testes para análise inferencial
23.2.1
Como selecionar os testes para a análise estatística inferencial?
24
Análise inferencial
24.1
Raciocínio inferencial
24.1.1
O que é análise inferencial?
24.1.2
Quais são os tipos de raciocínio inferencial?
24.1.3
Quais são as questões fundamentais da análise inferencial?
24.2
Hipóteses científicas
24.2.1
O que é hipótese científica?
24.2.2
Quais são as fontes de ideias para gerar hipóteses científicas?
24.3
Hipóteses estatísticas
24.3.1
O que é hipótese nula?
24.3.2
O que é hipótese alternativa?
24.3.3
Qual hipótese está sendo testada?
24.4
Testes de hipóteses
24.4.1
Quais são os tipos de teste de hipóteses?
24.4.2
O que é uma família de hipóteses?
24.4.3
O que são testes
ad hoc
e
post hoc
?
24.4.4
Como ajustar a análise inferencial para hipóteses múltiplas?
24.4.5
O que são testes unicaudais e bicaudais?
24.4.6
O que reportar após um teste de hipótese?
24.5
Inferência visual
24.5.1
O que é inferência visual?
24.5.2
Por que usar intervalos de confiança para inferência visual?
24.5.3
Como interpretar intervalos de confiança em uma figura?
24.6
Interpretação de análise inferencial
24.6.1
Como interpretar uma análise inferencial?
24.6.2
O que são resultados ‘positivos’ e ‘negativos’ ou inconclusivos em teste de hipótese?
24.6.3
Qual a importância de resultados ‘negativos’?
24.6.4
Resultados inconclusivos: Ausência de evidência ou evidência de ausência?
24.7
Erros de inferência
24.7.1
O que são erros de inferência estatística?
24.7.2
O que são erros Tipo I e Tipo II?
24.7.3
O que são erros Tipo S e Tipo M?
25
Tamanho do efeito e P-valor
25.1
Tamanho do efeito
25.1.1
O que é o tamanho do efeito?
25.1.2
Quais são os tipos de tamanho do efeito?
25.1.3
Como converter um tamanho de efeito em outro?
25.1.4
Como interpretar um tamanho do efeito?
25.2
Efeitos brutos e padronizados
25.2.1
O que é efeito bruto?
25.2.2
O que é efeito padronizado?
25.3
Efeito principal
25.3.1
O que é efeito principal?
25.4
Efeito de interação
25.4.1
O que é efeito de interação?
25.5
Efeito de mediação
25.5.1
O que é um mediador de efeito?
25.5.2
O que é efeito de mediação?
25.5.3
O que é efeito direto?
25.5.4
O que é efeito indireto?
25.5.5
O que é efeito total?
25.6
Efeito de modificação
25.6.1
O que é um modificador de efeito?
25.6.2
O que é efeito de modificação?
25.7
P-valor
25.7.1
O que é significância estatística?
25.7.2
Como justificar o nível de significância estatística de um teste?
25.7.3
O que é o P-valor?
25.7.4
Como interpretar o P-valor?
25.7.5
O que o P-valor não é?
25.7.6
Qual a origem do ‘P<0,05’?
25.7.7
Quais são os complementos ou alternativas ao P-valor?
26
Testes estatísticos
26.1
Testes de Qui-quadrado (
\(\chi^2\)
)
26.2
Teste exato de Fisher
27
Comparação
27.1
Análise inferencial de comparação
27.1.1
O que é análise de comparação de dados?
27.2
F-teste
27.2.1
O que é o F-teste?
27.2.2
Quando usar o F-teste?
27.2.3
Quais são os pressupostos?
27.2.4
Como interpretar o resultado?
27.2.5
O que reportar em publicações?
28
Associação
28.1
Análise inferencial de associação
28.1.1
O que é análise de associação?
28.2
Associação bivariada
28.2.1
O que são análises de associação bivariada?
28.2.2
Quais testes podem ser usados para análises de associação bivariada?
28.3
Associação multivariada
28.3.1
O que são análises de associação multivariada?
28.3.2
Quais testes podem ser usados para análises de associação multivariada?
29
Correlação
29.1
Análise inferencial de correlação
29.1.1
O que é covariância?
29.1.2
O que é correlação?
29.1.3
Qual é a interpretação das medidas de correlação?
29.1.4
Quais precauções devem ser tomadas na interpretação de medidas de correlação?
29.2
Coeficientes de correlação
29.2.1
Quais coeficientes podem ser usados em análises de correlação?
29.3
Colinearidade
29.3.1
O que é colinearidade?
29.3.2
Como identificar colinearidade na matriz de correlação?
30
Regressão
30.1
Análise de regressão
30.1.1
O que é regressão?
30.1.2
Quais são os algoritmos de regressão?
30.2
Estruturas de análise de regressão
30.2.1
O que são análises de regressão simples?
30.2.2
O que são análises de regressão multivariável?
30.2.3
O que são análises de regressão multivariada?
30.3
Tipos e famílias de modelos de regressão
30.3.1
O que são modelos de regressão linear?
30.3.2
O que são modelos de regressão polinomial?
30.3.3
O que são modelos de regressão não-linear?
30.3.4
O que são modelos de regressão logística?
30.3.5
O que são modelos de regressão multinomial?
30.3.6
O que são modelos de regressão ordinal?
30.3.7
O que são modelos de regressão de Poisson?
30.3.8
O que são modelos de regressão binomial negativa?
30.3.9
O que são modelos de regressão Gama?
30.3.10
O que são modelos de regressão com efeitos mistos?
30.3.11
O que são modelos de regressão com efeitos mistos generalizados?
30.3.12
O que são modelos de regressão ridge?
30.3.13
O que são modelos de regressão lasso?
30.4
Preparação de variáveis
30.4.1
Como preparar as variáveis categóricas para análise de regressão?
30.4.2
Por que é comum escolher a categoria mais frequente como referência em modelos epidemiológicos?
30.5
Multicolinearidade
30.5.1
O que é multicolinearidade?
30.5.2
Como diagnosticar multicolinearidade de forma quantitativa?
30.5.3
O que fazer em caso de multicolinearidade elevada?
30.6
Redução de dimensionalidade
30.6.1
Correlação bivariada pode ser usada para seleção de variáveis em modelos de regressão multivariável?
30.6.2
Variáveis sem significância estatística devem ser excluídas do modelo final?
30.6.3
Por que métodos de regressão gradual não são recomendados para seleção de variáveis em modelos de regressão multivariável?
30.6.4
O que pode ser feito para reduzir o número de variáveis candidatas em modelos de regressão multivariável?
30.6.5
Quando devemos forçar uma variável no modelo?
30.7
Suposições dos modelos de regressão
30.7.1
Quais suposições são feitas para regressão?
30.7.2
Como avaliar as suposições de uma regressão?
PARTE 7: MODELAGEM E ANÁLISES AVANÇADAS
31
Modelos
31.1
Modelos
31.1.1
O que são modelos?
31.1.2
O que é modelagem?
31.1.3
Por que a escolha do modelo é complexa?
31.2
Modelos estocásticos
31.2.1
O que são modelos estocásticos?
31.2.2
O que são cadeias de Markov?
31.3
Preditores e desfechos
31.3.1
O que são desfechos de um modelo?
31.3.2
O que são preditores de um modelo?
31.3.3
Como selecionar preditores para um modelo?
31.4
Suposições dos modelos
31.4.1
Quais suposições são feitas para modelagem?
31.4.2
Como avaliar as suposições de um modelo?
31.5
Avaliação de modelos
31.5.1
Como avaliar a qualidade de ajuste de um modelo?
31.6
Validação de modelos
31.6.1
Como validar modelos estatísticos?
31.7
Calibração de modelos
31.7.1
Como calibrar modelos estatísticos?
31.8
Comparação de modelos
31.8.1
Como comparar modelos de aprendizagem de máquina?
32
Modelagem temporal
32.1
Modelos temporais
32.1.1
O que são modelos temporais?
33
Modelagem espacial
33.1
Modelos espaciais
33.1.1
O que são modelos espaciais?
34
Modelagem de sobrevida
34.1
Sobrevida
34.1.1
O que é sobrevida?
34.2
Análise de sobrevida
34.2.1
O que é análise de sobrevida?
35
Redes
35.1
Análise de redes
35.1.1
O que é análise de rede?
36
Análise preditiva
36.1
Predição via modelagem
36.1.1
O que são predições?
36.2
Risco de vieses em estudos de predição
36.2.1
Como avaliar o risco de vieses em estudos de predição?
37
Análise causal
37.1
Causalidade
37.1.1
O que é análise causal?
37.1.2
Quais os dois grandes tipos de causalidade?
37.2
Abordagens filosóficas e estatísticas da causalidade
37.2.1
O que é realidade causal?
37.2.2
Por que estatísticos historicamente evitaram falar em causalidade?
37.3
Inferência causal em estudos observacionais
37.3.1
Como diferenciar associação de causalidade?
37.3.2
Quais critérios ajudam a sustentar inferência causal?
37.3.3
Qual o papel dos caminhos causais (DAGs)?
37.3.4
Como lidar com confundimento residual?
37.4
Critérios de Hill para inferência causal
37.4.1
Quais são os nove critérios?
37.4.2
Hill propôs um checklist rígido?
37.5
Críticas contemporâneas aos critérios de Hill
37.5.1
Qual critério é indispensável?
37.5.2
A força da associação garante causalidade?
37.5.3
A consistência é indispensável?
37.5.4
O critério da especificidade é válido?
37.5.5
O gradiente biológico (dose–resposta) é confiável?
37.5.6
A plausibilidade e a coerência são objetivas?
37.5.7
Evidência experimental é decisiva?
37.5.8
Analogia é útil?
37.6
Visão atual sobre os critérios de Hill
37.6.1
Como os critérios de Hill foram revisitados?
37.6.2
Quais mudanças na interpretação?
37.7
Linguagem causal em estudos observacionais
37.7.1
Quais são as principais recomendações para relatar causalidade?
37.8
Efeitos diretos e indiretos
37.8.1
Como distinguir efeitos diretos de indiretos?
37.9
O papel do tempo e a causalidade dinâmica
37.9.1
O que é Granger–Schweder Causality?
37.9.2
Por que o tempo é essencial na análise causal?
37.10
Diagrama acíclico direcionado (DAG)
37.10.1
O que são DAGs?
37.10.2
Quais são os padrões causais básicos?
PARTE 8: ANÁLISES AVANÇADAS
38
Aprendizado de máquina
38.1
Aprendizado de máquina
38.1.1
O que é aprendizado de máquina?
38.2
Tipos de aprendizado
38.2.1
O que é aprendizado supervisionado?
38.2.2
O que é aprendizado não supervisionado?
38.2.3
O que é aprendizado semi-supervisionado?
38.2.4
O que é aprendizado por reforço?
38.2.5
O que é aprendizado profundo?
38.3
Principais algoritmos
38.3.1
Quais são os principais algoritmos de aprendizado de máquina?
38.4
Desbalanceamento de classes
38.4.1
O que é desbalanceamento de classes (
class imbalance
)?
38.4.2
Por que o desbalanceamento é um problema?
38.4.3
Quais são as abordagens mais comuns para lidar com desbalanceamento de classes?
38.4.4
Qual é o impacto do desbalanceamento de classes na calibração de modelos?
39
Inteligência artificial
39.1
Inteligência artificial
39.1.1
O que é inteligência artificial (IA)?
39.1.2
Qual é a unidade básica de IA?
39.1.3
Como ela se relaciona com estatística, ciência de dados e aprendizado de máquina?
39.2
Neurônios artificiais
39.2.1
O que são neurônios artificiais?
39.3
Rede neural artificial
39.3.1
O que é uma rede neural?
39.3.2
Quais são as funções de ativação mais comuns?
39.4
Espaço de decisão
39.4.1
O que é espaço de decisão?
39.4.2
Como ele é visualizado?
39.5
Áreas da IA
39.5.1
Quais são as principais áreas de aplicação da IA?
39.5.2
Quais são exemplos de aplicação prática?
39.6
Técnicas modernas
39.6.1
Quais são as técnicas modernas de IA?
39.7
IA generativa e grandes modelos de linguagem
39.7.1
O que são grandes modelos de linguagem (
large language models
, LLM)?
39.7.2
Como funcionam modelos como GPT, BERT e similares?
PARTE 9: PLANEJAMENTO DE ESTUDOS
40
Poder estatístico
40.1
Poder do teste
40.1.1
O que é poder do teste?
40.1.2
O que é análise de poder do teste?
40.1.3
Quando realizar a análise de poder do teste?
40.1.4
Por que a análise de poder do teste
post hoc
é inadequada?
40.1.5
O que pode ser realizado ao invés da análise de poder?
41
Tamanho da amostra
41.1
Tamanho da amostra
41.1.1
O que é tamanho da amostra?
41.1.2
Por que determinar o tamanho da amostra é importante?
41.1.3
Quais fatores devem ser considerados para determinar o tamanho da amostra?
41.1.4
Quais aspectos éticos estão envolvidos no tamanho da amostra?
41.2
Cálculo do tamanho da amostra
41.2.1
Como calcular o tamanho da amostra?
41.2.2
Como especificar o tamanho do efeito esperado?
41.3
Perdas de amostra
41.3.1
O que é perda de amostra?
41.3.2
Por que a perda de amostra é um problema?
41.3.3
Como evitar perda de amostra?
41.4
Ajustes no tamanho da amostra
41.4.1
Por que ajustar o tamanho da amostra?
41.4.2
Como ajustar para perda amostral?
41.5
Justificativa do tamanho da amostra
41.5.1
Como justificar o tamanho da amostra de um estudo?
42
Plano de análise
42.1
Plano de análise estatística
42.1.1
O que é plano de análise estatística?
42.2
Diretrizes para redação
42.2.1
Quais são as diretrizes para redação de planos de análise estatística?
PARTE 10: DELINEAMENTOS E SÍNTESE DE EVIDÊNCIAS
43
Delineamento de estudos
43.1
Critérios de delineamento
43.1.1
Quais critérios são utilizados para classificar os delineamentos de estudos?
43.2
Alocação
43.2.1
O que é alocação?
43.3
Cegamento
43.3.1
O que é cegamento?
43.4
Pareamento
43.4.1
O que é pareamento?
43.5
Aleatorização
43.5.1
O que é aleatorização?
43.6
Taxonomia de estudos
43.6.1
Como podem ser classificados os estudos científicos?
44
Estudos observacionais
44.1
Características
44.1.1
Quais são as características de estudos observacionais?
44.2
Diretrizes para redação
44.2.1
Quais são as diretrizes para redação de estudos observacionais?
45
Propriedades psicométricas
45.1
Características
45.1.1
O que são propriedades psicométricas?
45.2
Análise fatorial exploratória
45.2.1
O que é análise fatorial exploratória?
45.3
Análise fatorial confirmatória
45.3.1
O que é análise fatorial confirmatória?
45.4
Validade de conteúdo
45.4.1
O que é validade interna?
45.4.2
O que é validade externa?
45.4.3
Que fatores afetam a validade?
45.4.4
Como avaliar a validade de um estudo?
45.5
Validade de face
45.5.1
O que é validade de face?
45.6
Validade do construto
45.6.1
O que é construto?
45.7
Validade fatorial
45.7.1
O que é validade fatorial?
45.8
Validade convergente
45.8.1
O que é validade convergente?
45.9
Validade discriminante
45.9.1
O que é validade discriminante?
45.10
Validade de critério
45.10.1
O que é validade de critério?
45.11
Validade concorrente
45.11.1
O que é concorrente?
45.11.2
O que é validade concorrente?
45.11.3
O que é validade preditiva?
45.12
Responsividade
45.12.1
O que é responsividade?
45.13
Concordância
45.13.1
O que é concordância?
45.13.2
Quais métodos são adequados para análise de concordância de variáveis dicotômicas?
45.13.3
Quais métodos não são adequados para análise de concordância de variáveis dicotômicas?
45.13.4
Quais métodos são adequados para análise de concordância de variáveis categóricas?
45.13.5
Quais métodos são adequados para análise de concordância de variáveis categóricas e contínuas?
45.13.6
Quais métodos são adequados para análise de concordância de variáveis ordinais?
45.13.7
Quais métodos são adequados para análise de concordância de variáveis contínuas?
45.13.8
Quais métodos não são adequados para análise de concordância de variáveis contínuas?
45.13.9
Quais métodos são adequados para modelagem de concordância?
45.14
Confiabilidade
45.14.1
O que é confiabilidade?
45.14.2
Quais métodos são adequados para análise de confiabilidade?
45.15
Diretrizes para redação
45.15.1
Quais são as diretrizes para redação de estudos de propriedades psicométricas?
46
Desempenho diagnóstico
46.1
Características
46.1.1
Quais são as características de estudos de desempenho diagnóstico?
46.2
Tabelas 2x2
46.2.1
O que é uma tabela de confusão 2x2?
46.2.2
Como analisar o desempenho diagnóstico em tabelas 2x2?
46.2.3
Quais probabilidades caracterizam o desempenho diagnóstico de um teste em tabelas 2x2?
46.3
Tabelas 2x3
46.3.1
O que é uma tabela de confusão 2x3?
46.3.2
Como as regiões POS, BND e NEG são definidas?
46.3.3
Qual é o formato de uma tabela 2×3?
46.3.4
Quais são as medidas básicas na 2×3?
46.3.5
Como escolher os limiares
\(\alpha\)
e
\(\beta\)
?
46.3.6
Quando preferir 3-vias em vez de 2×2?
46.4
Curvas ROC
46.4.1
O que representa a curva ROC?
46.4.2
Quais são os tipos de curva ROC?
46.4.3
Como definir o melhor ponto de corte?
46.4.4
O que é a área sob a curva (AUROC)?
46.4.5
Como calcular a AUC?
46.4.6
Como interpretar a área sob a curva (ROC)?
46.4.7
Por que uma AUC menor que 0.5 está errada?
46.4.8
Como analisar o desempenho diagnóstico em desfechos com distribuição trimodal na população?
46.5
Gráficos
crosshair
46.5.1
O que um gráfico
crosshair
?
46.6
Interpretação da validade de um teste
46.6.1
Que itens devem ser verificados na interpretação de um estudo de validade?
46.7
Diretrizes para redação
46.7.1
Quais são as diretrizes para redação de estudos diagnósticos?
47
Ensaios quase-experimentais
47.1
Características
47.1.1
Quais são as características de ensaios quase-experimentais?
47.2
Diretrizes para redação
47.2.1
Quais são as diretrizes para redação de ensaios quase-experimentais?
48
Ensaios experimentais
48.1
Ensaio clínico aleatorizado
48.1.1
Quais são as características de ensaios clínicos aleatorizados?
48.1.2
Quais são as estratégias para metodológicas para reduzir vieses metodológicos?
48.2
Modelos de análise de comparação
48.2.1
Que modelos podem ser utilizados para comparações?
48.3
Comparação na linha de base
48.3.1
O que são dados na linha de base?
48.3.2
O que é comparação entre grupos na linha de base em ensaios clínicos aleatorizados?
48.3.3
Para quê comparar grupos na linha de base em ensaios clínicos aleatorizados?
48.3.4
Quais são as razões para diferenças entre grupos de tratamento nas (co)variáveis na linha de base?
48.3.5
Quais cenários permitem a comparação entre grupos na linha de base em ensaios clínicos aleatorizados?
48.3.6
Por que não se deve comparar grupos na linha de base em ensaios clínicos aleatorizados?
48.3.7
Quais estratégias podem ser adotadas para substituir a comparação entre grupos na linha de base em ensaios clínicos aleatorizados?
48.4
Comparação intragrupos
48.4.1
Por que não se deve comparar intragrupos (pré - pós) em ensaios clínicos aleatorizados?
48.5
Comparação entre grupos
48.5.1
O que é comparação entre grupos em ensaios clínicos aleatorizados?
48.5.2
O que pode ser comparado entre grupos?
48.5.3
Qual é a comparação entre grupos mais adequada em ensaios clínicos aleatorizados?
48.6
Comparação de subgrupos
48.6.1
O que é comparação de subgrupos em ensaios clínicos aleatorizados?
48.6.2
Como realizar a comparação de subgrupos em ensaios clínicos aleatorizados?
48.6.3
Como interpretar a comparação de subgrupos em ensaios clínicos aleatorizados?
48.7
Efeito de interação
48.7.1
Por que analisar o efeito de interação?
48.7.2
Quando usar o termo de interação?
48.8
Ajuste de covariáveis
48.8.1
Quais variáveis devem ser utilizadas no ajuste de covariáveis?
48.8.2
Quais os benefícios do ajuste de covariáveis?
48.8.3
Quais os riscos do ajuste de covariáveis?
48.9
Imputação de dados perdidos
48.9.1
Como lidar com os dados perdidos em desfechos?
48.9.2
Como lidar com os dados perdidos em covariáveis?
48.10
Diretrizes para redação
48.10.1
Quais são as diretrizes para redação de ensaios experimentais?
49
Revisão sistemática
49.1
Revisão sistemática de literatura
49.1.1
O que é revisão sistemática?
49.2
Diretrizes para revisão sistemática
49.2.1
Quais são as diretrizes para revisão sistemática?
50
Meta-análise
50.1
Características
50.1.1
O que é meta-análise?
50.2
Modelos de meta-análise
50.3
Conversão de Medidas em Meta-análises
50.3.1
O que fazer quando os estudos apresentam resultados com diferentes parâmetros?
50.4
Interpretação de efeitos em meta-análise
50.4.1
Como avaliar a variação do tamanho do efeito?
50.4.2
Como avaliar a heterogeneidade entre os estudos?
50.5
Interpretação do Forest Plot
50.5.1
O que é um forest plot?
50.5.2
2. Quais são as seis colunas básicas que um forest plot geralmente apresenta?
50.5.3
Como diferenciar um desfecho binário de um contínuo em um forest plot?
50.5.4
4. O que representa o ponto central da caixa e o tamanho desta no gráfico?
50.5.5
5. Qual é o significado da linha vertical do “nenhum efeito”?
50.5.6
6. Como interpretar o diamante na parte inferior do forest plot?
50.5.7
Como a heterogeneidade pode ser avaliada no forest plot?
50.5.8
Quais são as interpretações usuais para os valores de
\(I^{2}\)
?
50.6
Viés de publicação em meta-análises
50.6.1
O que é viés de publicação?
50.6.2
Quais métodos podem ser usados para identificar viés de publicação?
50.6.3
O que é um gráfico de funil (
funnel plot
)?
50.6.4
A assimetria do
funnel plot
indica sempre viés de publicação?
50.6.5
O que é
trim and fill
?
50.6.6
O que é o teste de Egger?
50.6.7
O que é o teste de Peters?
50.6.8
Quais são as recomendações para testar a assimetria?
50.6.9
Como interpretar os resultados de testes de viés de publicação?
50.7
Diretrizes para redação
50.7.1
Quais são as diretrizes para redação de meta-análises?
51
Análise qualitativa
51.1
Análise qualitativa
51.1.1
O que é análise qualitativa?
51.2
Representação de texto
51.2.1
O que é tokenização?
51.2.2
Modelagem com N-gramas
51.2.3
O que são n-gramas?
PARTE 11: COMUNICAÇÃO E RELATO CIENTÍFICO
52
Redação de resultados
52.1
Resultados da análise estatística
52.1.1
Como redigir os resultados da análise estatística?
52.2
Diretrizes e Listas
52.2.1
Quais diretrizes estão disponíveis para redação estatística?
52.2.2
Quais listas de verificação estão disponíveis para redação estatística?
53
Diretrizes e Listas
53.1
Diretrizes
53.1.1
Quais são as diretrizes para relatórios estatísticos em pesquisas?
53.2
Listas de verificação
53.2.1
Quais são as listas de verificação para relatórios estatísticos em pesquisas?
54
Fontes externas
54.1
Fontes de informação externas
54.1.1
American Heart Association
54.1.2
American Physiological Society
54.1.3
American Statistical Association
54.1.4
British Medicine Journal
54.1.5
Enhancing the QUality And Transparency Of health Research Network
54.1.6
Journal of the Amercan Medical Association
54.1.7
Nature Publishing Group
54.1.8
Oxford Reference
54.1.9
Royal Statistical Society
54.1.10
Statistics in Medicine
54.1.11
BMC Trials
54.1.12
The Journal of Applied Statistics in the Pharmaceutical Industry
REFERÊNCIAS
Referências
Publicado com Bookdown
Ciência com R
PARTE 7: MODELAGEM E ANÁLISES AVANÇADAS
Estratégias para entender relações complexas, prever resultados e explorar padrões ocultos