e-Book | Consultoria
Capa
Dedicatória
Agradecimentos
Apresentação
Sobre o autor
PARTE 1: PENSAMENTO CIENTÍFICO
1
Pensamento probabilístico
1.1
Experimento
1.1.1
O que é um experimento?
1.1.2
O que é um experimento aleatório?
1.2
Espaço amostral e eventos discretos
1.2.1
O que é espaço amostral discreto?
1.2.2
O que é evento discreto?
1.2.3
O que é espaço de eventos discretos?
1.3
Espaço amostral e eventos contínuos
1.3.1
O que é espaço amostral contínuo?
1.3.2
O que é evento contínuo?
1.3.3
O que é espaço de eventos contínuo?
1.4
Probabilidade
1.4.1
O que é probabilidade?
1.4.2
Quais são os axiomas da probabilidade?
1.4.3
Quais as consequências dos axiomas da probabilidade?
1.5
Independência e probabilidade
1.5.1
O que é independência em estatística?
1.5.2
O que é probabilidade marginal?
1.5.3
O que é probabilidade conjunta?
1.5.4
O que é probabilidade condicional?
1.6
Leis dos números anômalos
1.6.1
O que é a lei dos números anômalos?
1.7
Leis dos pequenos números
1.7.1
O que é a lei dos pequenos números?
1.7.2
Quais são as versões da lei dos pequenos números?
1.8
Leis dos grandes números
1.8.1
O que é a lei dos grandes números?
1.8.2
Quais são as versões da lei dos grandes números?
1.9
Teorema central do limite
1.9.1
O que é teorema central do limite?
1.9.2
Quais as condições de validade do teorema central do limite?
1.9.3
Qual a relação entre a lei dos grandes números e o teorema central do limite?
1.9.4
Qual a relevância do teorema central do limite para a análise estatística?
1.10
Regressão para a média
1.10.1
O que é regressão para a média?
1.10.2
Qual a causa da regressão para a média?
1.10.3
Por que detectar o fenômeno de regressão para a média?
1.10.4
Como detectar o fenômeno de regressão para a média?
1.10.5
Como o fenômeno de regressão para a média pode ser evitado?
2
Pensamento estatístico
2.1
Unidade de análise
2.1.1
O que é unidade de análise?
2.1.2
Por que identificar a unidade de análise de um estudo?
2.1.3
Que medidas podem ser obtidas da unidade de análise de um estudo?
2.2
População
2.2.1
O que é população?
2.2.2
O que é representatividade e por que ela importa?
2.3
Amostra
2.3.1
O que é amostra?
2.3.2
Por que usar dados de amostras?
2.4
Amostragem
2.4.1
O que é amostragem?
2.4.2
Quais métodos de amostragem são usados para obter uma amostra da população?
2.4.3
O que é erro de amostragem?
2.5
Reamostragem
2.5.1
O que é reamostragem?
2.5.2
Por que utilizar reamostragem?
2.5.3
Quais procedimentos de reamostragem podem ser realizados?
2.6
Subamostragem
2.6.1
O que é subamostragem?
2.7
Superamostragem
2.7.1
O que é superamostragem?
3
Pensamento metodológico
3.1
Metodologia da pesquisa
3.1.1
O que é metodologia da pesquisa?
3.2
Relação Estatística-Metodologia
3.2.1
Qual a relação entre estatística e metodologia da pesquisa?
3.3
Pesquisa quantitativa vs. qualitativa
3.3.1
O que diferencia pesquisa qualitativa da quantitativa?
3.3.2
Por que essa dicotomia pode ser problemática?
3.3.3
Qual é uma alternativa para pensar o debate?
3.4
Pesquisa de métodos mistos
3.4.1
O que é pesquisa de métodos mistos?
3.4.2
Métodos mistos significam misturar paradigmas epistemológicos?
3.4.3
Quais são as principais dimensões do desenho de métodos mistos?
3.4.4
Quais são os delineamentos centrais em pesquisa de métodos mistos?
3.5
Pesquisa exploratória vs. confirmatória
3.5.1
O que são pesquisas exploratórias e confirmatórias?
3.5.2
Por que a dicotomia é limitada?
3.5.3
Quais são as melhores práticas de transparência?
3.6
Pesquisa translacional
3.6.1
O que é pesquisa translacional?
3.7
Pré-registro
3.7.1
O que é pré-registro?
3.8
Reprodutibilidade e Ciência Aberta
3.8.1
O que é reprodutibilidade?
3.8.2
Por que reprodutibilidade é importante?
3.8.3
Como contribuir para a reprodutibilidade?
3.9
Robustez
3.9.1
O que é robustez?
3.10
Replicabilidade
3.10.1
O que é replicabilidade?
3.11
Generalização
3.11.1
O que é generalização?
3.11.2
O que é generalização estatística?
3.11.3
O que é generalização analítica?
3.11.4
Quais são os mitos mais comuns sobre generalização?
3.11.5
Generalizações são conclusões definitivas?
3.11.6
Como a replicação contribui para a generalização?
3.11.7
Como revisões sistemáticas e meta-análises ampliam a generalização?
4
Pensamento computacional
4.1
R
4.1.1
O que é R?
4.1.2
Por que usar R?
4.1.3
O que é R Markdown?
4.1.4
Que programas de computador podem ser usados para análise estatística com R?
4.2
RStudio
4.2.1
O que é RStudio?
4.3
Scripts
4.3.1
O que são R scripts?
4.3.2
Quais são as melhores práticas na redação de
scripts
?
4.4
Pacotes
4.4.1
O que são pacotes?
4.5
Aplicativos Shiny
4.5.1
O que são Shiny Apps?
4.5.2
Quais são as boas práticas para desenvolver aplicativos Shiny reproduzíveis?
4.6
Manuscritos reproduzíveis
4.6.1
O que são manuscritos reproduzíveis?
4.6.2
Por que usar manuscritos reproduzíveis?
4.6.3
Como manuscritos reprodutíveis contribuem para a ciência?
4.7
Compartilhamento
4.7.1
Por que compartilhar scripts?
4.7.2
O que pode ser compartilhado?
4.7.3
Como preparar dados para compartilhamento?
4.7.4
Como preparar scripts para compartilhamento?
4.7.5
O que incluir no arquivo README?
5
Letramento estatístico
5.1
Introdução ao letramento estatístico
5.1.1
O que é letramento estatístico?
5.1.2
Por que o letramento estatístico é importante?
5.1.3
Quais são exemplos de armadilhas comuns na interpretação de estatísticas?
5.2
Elementos centrais do letramento estatístico
5.2.1
Quais são os elementos de conhecimento que sustentam o letramento estatístico?
5.2.2
Quais são os cinco elementos de conhecimento que sustentam o letramento estatístico?
5.2.3
Quais são os dois elementos de disposição que facilitam a ação estatisticamente letrada?
5.2.4
Que tipo de perguntas críticas devemos fazer ao interpretar informação estatística?
5.3
Hierarquia de letramento estatístico
5.3.1
Quais são os níveis da hierarquia de letramento estatístico?
5.3.2
Quais são os componentes centrais do letramento estatístico com literacia de dados?
5.4
Habilidades de letramento estatístico baseadas no pensamento crítico
5.4.1
Quais são as habilidades de letramento estatístico?
PARTE 2: AMEAÇAS À QUALIDADE DA EVIDÊNCIA CIENTÍFICA
6
Vieses
6.1
Vieses metodológicos
6.1.1
O que são vieses metodológicos?
6.2
Tipos de vieses metodológicos
6.2.1
Quais são os tipos de vieses metodológicos?
6.3
Diretrizes para redação
6.3.1
Quais são as diretrizes para redação de análises de vieses metodológicos?
7
Falácias estatísticas
7.1
Falácias
7.1.1
O que são falácias estatísticas?
7.1.2
O que é a falácia do jogador?
7.1.3
O que é a falácia da mão quente?
8
Paradoxos estatísticos
8.1
Paradoxos
8.1.1
O que são paradoxos estatísticos?
8.1.2
O que é o paradoxo de Abelson?
8.1.3
O que é o paradoxo de Berkson?
8.1.4
O que é o paradoxo de Ellsberg?
8.1.5
O que é o paradoxo de Freedman?
8.1.6
O que é o paradoxo de Hand?
8.1.7
O que é o paradoxo de Kelley?
8.1.8
O que é o paradoxo de Lindley?
8.1.9
O que é o paradoxo de Lord?
8.1.10
O que é o paradoxo de Meng?
8.1.11
O que é o paradoxo de Proebsting?
8.1.12
O que é o paradoxo de Simpson?
8.1.13
O que é o paradoxo de James-Stein?
8.1.14
O que é o paradoxo de Okie?
8.1.15
O que é o paradoxo da acurácia?
8.1.16
O que é o paradoxo do falso positivo?
8.1.17
O que é o paradoxo da caixa de Bertrand?
8.1.18
O que é o paradoxo do elevador?
8.1.19
O que é o paradoxo da amizade?
8.1.20
O que é o paradoxo do menino ou menina?
8.1.21
O que é o paradoxo do aniversário?
8.1.22
O que é o paradoxo do teste surpresa?
8.1.23
O que é o paradoxo do nó da gravata?
8.1.24
O que é o paradoxo de Monty Hall?
8.1.25
O que é o paradoxo da Bela Adormecida?
9
Práticas questionáveis em pesquisa
9.1
Práticas Questionáveis em Pesquisa
9.1.1
O que são práticas questionáveis em pesquisa?
9.1.2
Por que práticas questionáveis em pesquisa devem ser combatidas?
9.2
Prática não intencional e má conduta
9.2.1
Quais são as categorias de práticas questionáveis em pesquisa?
9.2.2
Quais práticas questionáveis podem ocorrer durante o planejamento do estudo?
9.2.3
Quais práticas questionáveis podem ocorrer durante a coleta de dados?
9.2.4
Quais práticas questionáveis podem ocorrer durante a análise dos dados?
9.2.5
Quais práticas questionáveis podem ocorrer durante a apresentação dos resultados?
9.2.6
Quais práticas questionáveis podem ocorrer durante a publicação e revisão por pares?
9.3
Prevenindo práticas questionáveis em pesquisa
9.3.1
Como prevenir práticas questionáveis?
9.4
Reações éticas e institucionais práticas questionáveis em pesquisa
PARTE 3: DO MUNDO REAL À TABELA
10
Variáveis e fatores
10.1
Variáveis
10.1.1
O que são variáveis?
10.1.2
Como são classificadas as variáveis?
10.2
Transformação de variáveis
10.2.1
Por que é importante classificar as variáveis?
10.2.2
O que é transformação de variáveis?
10.2.3
Por que transformar variáveis?
10.2.4
Quais transformações de variáveis podem ser aplicadas?
10.3
Centralização de variáveis (
centering
)
10.3.1
O que é centralização?
10.3.2
Por que centralizar?
10.4
Padronização de variáveis
10.4.1
O que é padronização?
10.4.2
Por que padronizar?
10.4.3
Quais são os métodos de padronização mais comuns?
10.4.4
Quais são as melhores práticas de nomenclatura ao padronizar variáveis?
10.5
Categorização de variáveis contínuas
10.5.1
O que é categorização de uma variável?
10.5.2
Por que não é recomendado categorizar variáveis contínuas?
10.5.3
Quais são as alternativas à categorização de variáveis contínuas?
10.6
Dicotomização de variáveis contínuas
10.6.1
O que são variáveis dicotômicas?
10.6.2
Quais argumentos são usados para defender a categorização ou dicotomização de variáveis contínuas?
10.6.3
Por que não é recomendado dicotomizar variáveis contínuas?
10.6.4
Quais cenários legitimam a dicotomização das variáveis contínuas?
10.6.5
Quais métodos são usados para dicotomizar variáveis contínuas?
10.7
Representação de variáveis categóricas
10.7.1
O que são variáveis indicadoras (
dummy variables
)?
10.7.2
Por que variáveis indicadoras são importantes?
10.7.3
Quantas variáveis indicadoras são necessárias para um fator?
10.7.4
O que é o nível de referência?
10.7.5
Por que não se usam k variáveis indicadoras para
\(k\)
níveis?
10.7.6
Variáveis indicadoras são uma forma de dicotomização?
10.7.7
Variáveis indicadoras alteram os dados originais?
10.8
Fatores
10.8.1
O que são fatores?
10.8.2
O que são níveis de um fator?
11
Dados e metadados
11.1
Dados
11.1.1
O que são dados?
11.1.2
O que são dados estruturados?
11.1.3
O que são dados não estruturados?
11.2
Big data
11.2.1
O que são grandes dados (
big data
)?
11.2.2
Quais são as fontes de dados?
11.2.3
O que são dados primários e secundários?
11.2.4
O que são dados quantitativos e qualitativos?
11.3
Metadados
11.3.1
O que são metadados?
11.3.2
Quais são as recomendações para os metadados de um banco de dados?
11.4
Armazenamento de dados
11.4.1
Como armazenar dados?
12
Medidas e instrumentos
12.1
Escalas
12.1.1
O que são escalas?
12.2
Medição e Medidas
12.2.1
O que é medição?
12.2.2
O que são medidas diretas?
12.2.3
O que são medidas derivadas?
12.2.4
O que são medidas por teoria?
12.2.5
O que são medidas únicas?
12.2.6
O que são medidas repetidas?
12.2.7
O que são medidas seriadas?
12.2.8
O que são medidas múltiplas?
12.3
Erro de medida
12.3.1
O que são erros de medida?
12.3.2
Quais fontes de variabilidade são comumente investigadas?
12.4
Instrumentos
12.4.1
O que são instrumentos?
12.5
Acurácia e precisão
12.5.1
O que é acurácia?
12.5.2
O que é precisão?
12.6
Viés e variabilidade
12.6.1
Qual é a relação entre viés e variabilidade?
13
Tabulação de dados
13.1
Planilhas eletrônicas
13.1.1
Qual a organização de uma tabela de dados?
13.1.2
Qual a estrutura básica de uma tabela para análise estatística?
13.1.3
O que usar para organizar tabelas para análise computadorizada?
13.1.4
O que não usar para organizar tabelas para análise computadorizada?
13.1.5
O que é recomendado e o que deve ser evitado na organização das tabelas para análise?
14
Vinculação e pareamento de dados
14.1
Vinculação e pareamento de dados
14.1.1
O que é vinculação e pareamento de dados?
14.2
Abordagens de vinculação
14.2.1
Quais são as abordagens de vinculação?
14.3
Erros de vinculação
14.3.1
Quais são os erros comuns na vinculação de dados?
14.4
Controle de qualidade
14.4.1
Como controlar a qualidade da vinculação de dados?
15
Dados perdidos e imputados
15.1
Dados perdidos
15.1.1
O que são dados perdidos?
15.1.2
Qual o problema de um estudo ter dados perdidos?
15.2
Mecanismos geradores de dados perdidos
15.2.1
Quais são os mecanismos geradores de dados perdidos?
15.2.2
Como identificar o mecanismo gerador de dados perdidos em um banco de dados?
15.3
Estratégias para lidar com dados perdidos
15.3.1
Que estratégias podem ser utilizadas na coleta de dados quando há expectativa de perda amostral?
15.3.2
Que estratégias podem ser utilizadas na análise quando há dados perdidos?
15.3.3
Que estratégias podem ser utilizadas na redação de estudos em que há dados perdidos?
15.4
Dados imputados
15.4.1
O que são dados imputados?
15.4.2
Quando a imputação de dados é indicada?
15.4.3
Quais são os métodos de imputação de dados?
16
Distribuições e parâmetros
16.1
Fontes de variabilidade
16.1.1
O que são fontes de variabilidade?
16.1.2
Quais são as principais fontes de variabilidade?
16.1.3
Por que identificar as fontes de variabilidade é importante?
16.2
Distribuições de probabilidade
16.2.1
O que são distribuições de probabilidade?
16.2.2
Como representar distribuições de probabilidade?
16.2.3
Quais características definem uma distribuição?
16.3
Tipos de distribuições
16.3.1
O que são distribuições empíricas?
16.3.2
O que são distribuições teóricas?
16.3.3
O que são distribuições amostrais?
16.3.4
Por que todas as distribuições são condicionais?
16.4
Distribuições univariadas
16.4.1
Quais são as distribuições mais comuns?
16.4.2
Quais são as funções de uma distribuição?
16.4.3
O que é a distribuição normal?
16.4.4
Que métodos podem ser utilizados para identificar a normalidade da distribuição?
16.4.5
O que são distribuições não-normais?
16.5
Distribuições multivariadas
16.5.1
O que são distribuições multivariadas?
16.6
Parâmetros
16.6.1
O que são parâmetros?
16.6.2
O que é uma análise paramétrica?
16.6.3
O que é uma análise não paramétrica?
16.6.4
Por que as análises paramétricas são preferidas?
16.6.5
Que parâmetros podem ser estimados?
16.7
Tendência central
16.7.1
Que parâmetros de tendência central podem ser estimados?
16.7.2
Como escolher o parâmetro de tendência central?
16.8
Dispersão
16.8.1
Que parâmetros de dispersão podem ser estimados?
16.8.2
Como escolher o parâmetro de dispersão?
16.8.3
O que é a correção de Bessel para variância?
16.8.4
Por que a correção de Bessel para variância é importante?
16.9
Proporção
16.9.1
Que parâmetros de proporção podem ser estimados?
16.10
Extremos
16.10.1
Que parâmetros extremos podem ser estimados?
16.11
Erro
16.11.1
Que parâmetros de erro podem ser estimados?
16.12
Distribuição
16.12.1
Que parâmetros de distribuição podem ser estimados?
16.13
Parâmetros robustos
16.13.1
O que são parâmetros robustos?
16.13.2
Por que utilizar parâmetros robustos?
16.13.3
O que é ponto de quebra?
16.13.4
Que parâmetros robustos podem ser estimados?
17
Dados anonimizados e sintéticos
17.1
Dados anonimizados
17.1.1
O que são dados anonimizados?
17.1.2
Por que anonimização perfeita não existe?
17.1.3
Quais são os principais tipos de ataques contra dados anonimizados?
17.1.4
Como anonimizar os dados de um banco?
17.1.5
Quais são as limitações das técnicas de anonimização?
17.1.6
Qual é o equilíbrio entre privacidade e utilidade?
17.2
Dados sintéticos
17.2.1
O que são dados sintéticos?
17.2.2
Como dados sintéticos podem ser usados em
digital twins
?
PARTE 4: ANÁLISES DESCRITIVAS E EXPLORATÓRIAS
18
Análise inicial de dados
18.1
Análise inicial de dados
18.1.1
O que é análise inicial de dados?
18.1.2
Como conduzir uma análise inicial de dados?
18.1.3
Quais problemas podem ser detectados na análise inicial de dados?
19
Análise exploratória de dados
19.1
Análise exploratória de dados
19.1.1
O que é análise exploratória de dados?
19.1.2
Quais são os objetivos centrais da análise exploratória de dados?
19.1.3
Por que conduzir a análise exploratória de dados?
19.2
Quarteto de Anscombe
19.2.1
O que é o Quarteto de Anscombe?
19.3
Ingredientes da análise exploratória de dados
19.3.1
Quais são os principais elementos que compõem a análise exploratória de dados?
19.3.2
Quais etapas constituem a análise exploratória de dados?
20
Análise descritiva
20.1
Análise descritiva
20.1.1
O que é análise descritiva?
20.1.2
Como apresentar os resultados descritivos?
20.2
Apresentação de resultados numéricos
20.2.1
O que são casas decimais?
20.2.2
O que são dígitos significativos?
20.2.3
Como arredondar dados numéricos?
21
Análise robusta
21.1
Raciocínio inferencial robusto
21.1.1
O que é análise robusta?
21.1.2
Por que usar análise robusta?
21.1.3
Quando usar análise robusta?
21.1.4
Por que métodos robustos são preferíveis?
21.2
Valores discrepantes
21.2.1
O que são valores discrepantes (
outliers
)?
21.2.2
Quais são os tipos de valores discrepantes?
21.2.3
Por que é importante avaliar valores discrepantes?
21.2.4
Como detectar valores discrepantes?
21.2.5
Quais são os métodos para detectar valores discrepantes?
21.2.6
Quais testes são apropriados para detectar valores discrepantes?
21.2.7
Como manejar os valores discrepantes?
21.2.8
Como conduzir análises com valores discrepantes?
21.2.9
Como lidar com
outliers
na análise exploratória de dados?
21.3
Valores influentes
21.3.1
O que são valores influentes?
21.3.2
O que é função de influência?
21.3.3
O que é ponto de quebra?
21.3.4
Como detectar valores influentes?
21.4
Métodos robustos de tratamento de
outliers
21.4.1
O que é Winsorização?
21.4.2
Quais são as alternativas à Winsorização?
22
Análise preditiva
22.1
Predição
22.1.1
O que são predições?
22.1.2
Como árvores de decisão são usadas para predição?
22.2
Interpretação e aplicação
22.2.1
Quais são as implicações do uso de árvores de decisão em predição?
22.3
Análise de curva de decisão
22.3.1
O que é a análise de curva de decisão?
22.3.2
O que significam os eixos da curva de decisão?
22.3.3
Como interpretar o benefício líquido?
22.3.4
Por que é importante comparar sempre com “tratar todos” e “tratar nenhum”?
22.3.5
Quais são os limites e usos da análise de curva de decisão?
22.3.6
A análise de curva de decisão pode ser conduzida sem dados individuais de pacientes?
22.3.7
Como funciona o cálculo do benefício líquido?
23
Análise causal
23.1
Causalidade
23.1.1
O que é análise causal?
23.1.2
Quais os dois grandes tipos de causalidade?
23.1.3
Como realizar uma análise causal?
23.2
Abordagens filosóficas e estatísticas da causalidade
23.2.1
O que é realidade causal?
23.2.2
Por que estatísticos historicamente evitaram falar em causalidade?
23.3
Ilusões de causalidade
23.3.1
O que são ilusões de causalidade?
23.3.2
Quais fatores favorecem a ilusão?
23.3.3
Como reduzir ilusões de causalidade?
23.4
Inferência causal em estudos observacionais
23.4.1
Como diferenciar associação de causalidade?
23.4.2
Quais critérios ajudam a sustentar inferência causal?
23.4.3
Qual o papel dos caminhos causais (DAGs)?
23.4.4
Como lidar com confundimento residual?
23.5
Critérios de Hill para inferência causal
23.5.1
Quais são os nove critérios?
23.5.2
Hill propôs um checklist rígido?
23.6
Críticas contemporâneas aos critérios de Hill
23.6.1
Qual critério é indispensável?
23.6.2
A força da associação garante causalidade?
23.6.3
A consistência é indispensável?
23.6.4
O critério da especificidade é válido?
23.6.5
O gradiente biológico (dose–resposta) é confiável?
23.6.6
A plausibilidade e a coerência são objetivas?
23.6.7
Evidência experimental é decisiva?
23.6.8
Analogia é útil?
23.7
Visão atual sobre os critérios de Hill
23.7.1
Como os critérios de Hill foram revisitados?
23.7.2
Quais mudanças na interpretação?
23.8
Linguagem causal em estudos observacionais
23.8.1
Quais são as principais recomendações para relatar causalidade?
23.9
Efeitos diretos e indiretos
23.9.1
Como distinguir efeitos diretos de indiretos?
23.10
O papel do tempo e a causalidade dinâmica
23.10.1
O que é causalidade de Granger?
23.10.2
Por que o tempo é essencial na análise causal?
23.11
Diagrama acíclico direcionado (DAG)
23.11.1
O que são DAGs?
23.11.2
Quais são os padrões causais básicos?
23.11.3
Quais são as regras básicas para análise causal?
23.11.4
Quais são as regras básicas para ajuste?
24
Análise qualitativa
24.1
Análise qualitativa
24.1.1
O que é análise qualitativa?
24.2
Representação de texto
24.2.1
O que é tokenização?
24.2.2
Modelagem com N-gramas
24.2.3
O que são n-gramas?
PARTE 5: ANÁLISES INFERENCIAIS
25
Análise inferencial
25.1
Raciocínio inferencial
25.1.1
O que é análise inferencial?
25.1.2
Quais são os tipos de raciocínio inferencial?
25.1.3
Quais são as questões fundamentais da análise inferencial?
25.2
Hipóteses científicas
25.2.1
O que é hipótese científica?
25.2.2
Quais são as fontes de ideias para gerar hipóteses científicas?
25.3
Hipóteses estatísticas
25.3.1
O que é hipótese nula?
25.3.2
O que é hipótese alternativa?
25.3.3
Qual hipótese está sendo testada?
25.4
Testes de hipóteses
25.4.1
Quais são os tipos de teste de hipóteses?
25.4.2
O que reportar após um teste de hipótese?
25.5
Intervalos de confiança e raciocínio de longo prazo
25.5.1
O que é um intervalo de confiança?
25.5.2
Intervalos de confiança e a lógica frequentista
25.5.3
O que um intervalo de confiança não representa
25.5.4
Relação entre intervalos de confiança e testes de hipóteses
25.5.5
Por que intervalos de confiança são centrais na inferência científica
25.6
Comparações múltiplas
25.6.1
O que é uma família de hipóteses?
25.6.2
O que são testes
ad hoc
e
post hoc
?
25.6.3
Como ajustar a análise inferencial para hipóteses múltiplas?
25.6.4
O que são testes unicaudais e bicaudais?
25.7
Inferência visual
25.7.1
O que é inferência visual?
25.7.2
Por que usar intervalos de confiança para inferência visual?
25.7.3
Como interpretar intervalos de confiança em uma figura?
25.8
Interpretação de análise inferencial
25.8.1
Como interpretar uma análise inferencial?
25.8.2
O que são resultados positivos” e “negativos” (inconclusivos) em teste de hipótese?
25.8.3
Qual a importância de resultados “negativos”?
25.8.4
Resultados inconclusivos: Ausência de evidência ou evidência de ausência?
25.9
Erros de inferência I, II, S e M
25.9.1
O que são erros de inferência estatística?
25.9.2
O que são erros Tipo I e Tipo II?
25.9.3
O que são erros Tipo S e Tipo M?
26
Suposições inferenciais
26.1
Suposições gerais em análises inferenciais
26.1.1
Quais são as suposições ao nível dos dados (condicionais ao modelo)?
26.1.2
Quais são as suposições ao nível do modelo?
26.1.3
Quais são as suposições ao nível do estudo?
26.2
Suposições implícitas e explícitas nos testes
26.2.1
Quais suposições implícitas são feitas nos testes estatísticos?
26.2.2
Quais suposições explícitas são feitas nos testes estatísticos?
26.3
Suposições causais que conectam dados observados a efeitos causais
26.3.1
Quais são as suposições causais que conectam dados observados a efeitos causais?
26.3.2
Qual a relação dessas suposições com as demais suposições inferenciais?
26.4
Diagnóstico e verificação
26.4.1
O que fazer quando suposições gerais falham?
26.4.2
O que fazer quando as suposições causais falham?
26.4.3
Como avaliar as suposições de uma regressão?
26.4.4
Como avaliar a independência entre variáveis?
26.5
Normalidade
26.5.1
Devemos testar as suposições de normalidade?
27
P-valor
27.1
P-valor
27.1.1
O que é o P-valor?
27.1.2
O que o P-valor não é?
27.2
Significância estatística
27.2.1
O que é significância estatística?
27.3
Interpretação do P-valor
27.3.1
Como interpretar o P-valor?
27.3.2
Existe uma crítica lógica à significância estatística?
27.3.3
O que é “prova probabilística por contradição”?
27.3.4
Qual é o equívoco central?
27.3.5
O que isso implica para a interpretação do P-valor?
27.3.6
Qual a origem do ‘P<0,05’?
27.3.7
Quais são os complementos ou alternativas ao P-valor?
27.4
P-valor de 2ª geração
27.4.1
O que é o P-valor de 2ª geração?
27.4.2
Como definir a hipótese nula intervalar e
\(\delta\)
?
27.4.3
Como calcular o SGPV?
27.4.4
Como interpretar o SGPV?
27.4.5
Relação com testes de equivalência
27.4.6
Propriedades frequenciais e múltiplas comparações
27.5
Distribuição de confiança
27.5.1
O que é distribuição de confiança?
27.5.2
Como interpretar a distribuição de confiança?
28
Tamanho do efeito
28.1
Tamanho do efeito
28.1.1
O que é o tamanho do efeito?
28.2
Tipos de tamanho do efeito
28.2.1
Como interpretar um tamanho do efeito?
28.2.2
O que é a diferença de média bruta?
28.2.3
Correlações podem ser consideradas tamanhos de efeito?
28.2.4
O que é o
\(q\)
de Cohen?
28.2.5
O que o
\(g\)
no teste do sinal?
28.2.6
O que é o
\(h\)
de Cohen?
28.2.7
O que representa o tamanho de efeito
\(w\)
?
28.2.8
O que é o tamanho de efeito
\(f\)
em ANOVA?
28.2.9
O que é o tamanho de efeito
\(f^2\)
em regressão?
28.2.10
O que é a estatística
\(\Lambda\)
de Wilks na MANOVA?
28.2.11
Como escolher o tamanho de efeito adequado?
28.3
Conversão entre tamanhos do efeito
28.3.1
Como converter um tamanho de efeito em outro?
28.4
Efeitos bruto e padronizado
28.4.1
O que é efeito bruto?
28.4.2
O que é efeito padronizado?
29
Seleção de testes
29.1
Multiverso de análises estatísticas
29.1.1
Por que escolher o teste é um problema?
29.2
Escolha de testes para análise inferencial
29.2.1
Como selecionar os testes para a análise estatística inferencial?
PARTE 6: RELAÇÕES ENTRE VARIÁVEIS
30
Descrição
30.1
Análise de descrição
30.1.1
O que é análise de descrição de dados?
30.2
Estimação
30.2.1
O que é estimativa?
30.2.2
O que é estimativa pontual?
30.2.3
O que é estimativa de intervalar?
30.2.4
O que é estimativa de parâmetro?
31
Comparação
31.1
Teste
t
de Student
31.2
Teste
t
de Welch
31.3
Teste de Mann-Whitney
31.4
Teste de Wilcoxon
31.5
Análise de variância
31.6
Análise de variância (Welch)
31.7
Análise de variância (Kruskal-Wallis)
32
Associação
32.1
Testes de Qui-quadrado (
\(\chi^2\)
)
296,297
32.2
Teste exato de Fisher
296,297
32.3
Teste de McNemar
32.4
Teste
Q
de Cochran
32.5
Teste de Cochran–Armitage
32.6
Razão de changes (
\(OR\)
) e risco relativo (
\(RR\)
)
33
Correlação
33.1
Coeficiente de correlação de Pearson (
\(r\)
) @ref(eq:pearson).
298,299
33.2
Coeficiente de correlação ponto-bisserial (
\(r_{s}\)
) @ref(eq:biserial).
298
33.3
Coeficiente de correlação de Spearman (
\(\rho\)
) @ref(eq:spearman).
298,299
33.4
Coeficiente de Kendall (
\(\tau\)
) @ref(eq:kendall).
298,299
33.5
Coeficiente de Cramér (
\(V\)
) @ref(eq:cramer).
REF?
33.6
Coeficiente de Sheperd (
\(\phi\)
) @ref(eq:sheperd).
REF?
33.7
Coeficiente de correlação tetracórica
\(r_{tet}\)
.
304,305
33.8
Coeficiente de correlação policórica
\(r_{pol}\)
.
305
33.9
Coeficiente de correlação ponto-bisserial
\(r_{pb}\)
.
33.10
Coeficiente de correlação bisserial
\(r_{s}\)
.
305
34
Redes
34.1
Análise de redes
34.1.1
O que é análise de rede?
34.1.2
Por que a análise de redes é útil em pesquisa científica?
34.1.3
Quais são as limitações da análise de redes?
34.2
Matriz de incidência
34.2.1
O que é uma matriz de incidência?
34.3
Elementos da rede
34.3.1
Quais são os principais elementos de uma rede?
34.3.2
Como as redes podem ser classificadas?
34.3.3
O que define a posição dos nodos em um grafo de rede?
34.4
Tipos de redes
34.4.1
Quais são os principais tipos de redes estatísticas?
34.4.2
Como reduzir associações espúrias em redes?
34.5
Métricas de rede
34.5.1
O que são medidas de centralidade?
35
Regressão
35.1
Análise de regressão
35.1.1
O que é regressão?
35.1.2
Quais são os algoritmos de regressão?
35.2
Estruturas de análise de regressão
35.2.1
O que são análises de regressão simples?
35.2.2
O que são análises de regressão multivariável?
35.2.3
O que são análises de regressão multivariada?
35.3
Tipos e famílias de regressão
35.3.1
O que são modelos de regressão linear?
35.3.2
O que são modelos de regressão polinomial?
35.3.3
O que são modelos de regressão não-linear?
35.3.4
O que são modelos de regressão logística?
35.3.5
O que são modelos de regressão multinomial?
35.3.6
O que são modelos de regressão ordinal?
35.3.7
O que são modelos de regressão de Poisson?
35.3.8
O que são modelos de regressão binomial negativa?
35.3.9
O que são modelos de regressão Gama?
35.3.10
O que são modelos de regressão com efeitos mistos?
35.3.11
O que são modelos de regressão com efeitos mistos generalizados?
35.3.12
O que são modelos de regressão ridge?
35.3.13
O que são modelos de regressão LASSO?
35.4
Preparação de variáveis
35.4.1
Como preparar as variáveis categóricas para análise de regressão?
35.4.2
Por que é comum escolher a categoria mais frequente como referência em modelos epidemiológicos?
35.5
Colinearidade
35.5.1
O que é colinearidade?
35.5.2
Como identificar colinearidade na matriz de correlação?
35.6
Multicolinearidade
35.6.1
O que é multicolinearidade?
35.6.2
Como diagnosticar multicolinearidade de forma quantitativa?
35.6.3
O que fazer em caso de multicolinearidade elevada?
35.7
Redução de dimensionalidade
35.7.1
Correlação bivariada pode ser usada para seleção de variáveis em modelos de regressão multivariável?
35.7.2
Variáveis sem significância estatística devem ser excluídas do modelo final?
35.7.3
Por que métodos de regressão gradual não são recomendados para seleção de variáveis em modelos de regressão multivariável?
35.7.4
O que pode ser feito para reduzir o número de variáveis candidatas em modelos de regressão multivariável?
35.7.5
Quando devemos forçar uma variável no modelo?
35.8
Seleção de variáveis em regressão
35.8.1
O que é seleção de variáveis em regressão?
35.8.2
Quais são os principais critérios de informação usados na seleção de variáveis?
35.8.3
Quais algoritmos podem ser usados para seleção automática?
36
Mediação
36.1
Análise de mediação
36.1.1
O que é análise de mediação?
PARTE 7: MODELAGEM
37
Modelos
37.1
Modelos
37.1.1
O que são modelos?
37.1.2
O que é modelagem?
37.1.3
Por que a escolha do modelo é complexa?
37.1.4
O que diferencia modelos clássicos e modernos em predição?
37.2
Modelos estocásticos
37.2.1
O que são modelos estocásticos?
37.2.2
O que são cadeias de Markov?
37.3
Efeito fixo
37.3.1
O que é efeito fixo?
37.4
Efeito aleatório
37.4.1
O que é efeito aleatório?
37.5
Efeito misto
37.5.1
O que é efeito misto?
37.6
Efeito principal
37.6.1
O que é efeito principal?
37.7
Efeito de interação
37.7.1
O que é efeito de interação?
37.8
Efeito de mediação
37.8.1
O que é um mediador de efeito?
37.8.2
O que é efeito de mediação?
37.8.3
O que é efeito direto?
37.8.4
O que é efeito indireto?
37.8.5
O que é efeito total?
37.9
Efeito de modificação
37.9.1
O que é um modificador de efeito?
37.9.2
O que é efeito de modificação?
37.10
Preditores e desfechos
37.10.1
O que são desfechos de um modelo?
37.10.2
O que são preditores de um modelo?
37.10.3
Como selecionar preditores para um modelo?
37.11
Desempenho e estabilidade de modelos
37.11.1
Como avaliar o desempenho dos modelos?
37.11.2
Qual modelo alcança estabilidade mais rapidamente?
37.12
Comparação de modelos
37.12.1
Como comparar modelos estatísticos?
37.12.2
Como comparar modelos de aprendizagem de máquina?
37.13
Avaliação de modelos
37.13.1
Como avaliar a qualidade de ajuste de um modelo?
37.14
Validação de modelos
37.14.1
Como validar modelos estatísticos?
37.15
Calibração de modelos
37.15.1
Como calibrar modelos estatísticos?
38
Modelagem estrutural
38.1
Modelos estruturais
38.1.1
O que é modelagem de equações estruturais (SEM)?
38.1.2
Em que a SEM difere de outras abordagens estatísticas?
38.2
Variáveis latentes
38.2.1
O que é uma variável latente?
38.2.2
O que é análise fatorial confirmatória (CFA)?
38.3
Aplicações avançadas
38.3.1
O que é modelo de curva de crescimento latente (LGC)?
38.3.2
O que é SEM Bayesiana?
38.3.3
O que é PLS-SEM?
38.3.4
O que caracteriza a PLS-SEM dentro da família da SEM?
38.3.5
Quando a PLS-SEM deve ser considerada?
38.4
Ajuste e avaliação do modelo
38.4.1
Quais são os principais índices de ajuste em SEM?
38.5
Problemas comuns na aplicação de SEM
38.5.1
Quais são problemas frequentes na aplicação de SEM?
38.5.2
Por que a especificação do modelo é crítica em SEM?
39
Modelagem temporal
39.1
Modelos temporais
39.1.1
O que são modelos temporais?
40
Modelagem espacial
40.1
Modelos espaciais
40.1.1
O que são modelos espaciais?
41
Modelagem de sobrevida
41.1
Análise de sobrevida
41.1.1
O que é análise de sobrevida?
41.1.2
Quando usar análise de sobrevida?
41.2
Eventos
41.2.1
O que caracteriza um “evento” em análise de sobrevida?
41.3
Dados censurados
41.3.1
O que são dados censurados?
41.3.2
Quais são os tipos de censura de dados?
41.4
Medidas de associação em análise de sobrevida
41.4.1
O que é a função de sobrevida?
41.4.2
O que é a função de risco?
41.4.3
O que é a razão de risco (
hazard ratio
)?
41.4.4
Qual é a diferença entre modelos de Kaplan–Meier e Cox?
41.4.5
O que é o tempo médio de sobrevida restrito?
41.5
Modelo de Kaplan–Meier
41.5.1
O que é a curva de Kaplan–Meier?
41.5.2
Como interpretar as curvas de Kaplan–Meier?
41.6
Modelos de Cox
41.6.1
O que é o modelo de Cox?
41.6.2
Como interpretar o coeficiente do modelo de Cox?
PARTE 8: REPRESENTAÇÃO, APRENDIZADO DE MÁQUINA E INTELIGÊNCIA ARTIFICIAL
42
Representações
42.1
Representações de dados e extração de atributos
42.1.1
Como representar texto como vetores?
42.1.2
O que é
one-hot
,
multi-hot
e
count encoding
?
43
Aprendizado de máquina
43.1
Aprendizado de máquina
43.1.1
O que é aprendizado de máquina?
43.2
Tipos de aprendizado
43.2.1
O que é aprendizado supervisionado?
43.2.2
O que é aprendizado não supervisionado?
43.2.3
O que é aprendizado por reforço?
43.2.4
Quais são os limites do progresso em classificadores supervisionados?
43.2.5
Quais problemas práticos limitam a generalização de classificadores?
43.3
Fluxo de desenvolvimento de modelos
43.3.1
Qual é o fluxo típico de desenvolvimento de modelos de aprendizado de máquina?
43.3.2
O que são conjuntos de treinamento, validação e teste?
43.3.3
O que são hiperparâmetros?
43.4
Principais algoritmos
43.4.1
Quais são os principais algoritmos de aprendizado de máquina?
43.4.2
Por que estudos comparativos entre classificadores podem ser enganosos?
43.5
Regressão logística
43.5.1
O que é regressão logística?
43.5.2
Por que utilizar regressão logística em problemas de classificação?
43.6
Máquina de vetores de suporte
43.6.1
O que são máquinas de vetores de suporte?
43.7
K-nearest neighbours
43.7.1
O que é
K-nearest neighbours
?
43.8
Árvores de decisão
43.8.1
O que são árvores de decisão?
43.8.2
Quais são os principais usos de árvores de decisão?
43.8.3
Quais são os componentes básicos de uma árvore de decisão?
43.8.4
Como árvores de decisão realizam as divisões nos dados?
43.8.5
Como funcionam
splitting
,
stopping
e
pruning
?
43.8.6
Quais são as vantagens e limitações de árvores de decisão?
43.8.7
Espaço de decisão em árvores de decisão vs. regressão logística
43.9
Random forests
43.9.1
O que são
random forests
?
43.10
Ensemble
43.10.1
O que são
ensemble
?
43.11
K-means Clustering
43.11.1
O que é
K-means clustering
?
43.11.2
Existe um número “ótimo” de
clusters
?
43.11.3
Como escolher o número de
clusters
?
43.11.4
Por que o método do “cotovelo” pode ser problemático?
43.12
Análise de componentes principais
43.12.1
O que é análise de componentes principais?
43.13
Métricas de distância e similaridade
43.13.1
O que é uma métrica?
43.13.2
Quais são as principais métricas?
43.13.3
Como escolher a métrica adequada?
43.13.4
Quais métricas são indicadas para avaliar modelos preditivos?
43.13.5
Quais métricas são consideradas inadequadas ou problemáticas?
43.14
Avaliação de modelos de classificação
43.14.1
Por que é importante avaliar o desempenho de um modelo de classificação?
43.14.2
O que é uma matriz de confusão 2x2?
43.14.3
Como interpretar uma matriz de confusão 2x2?
43.14.4
Quais métricas caracterizam o desempenho de um classificador?
43.15
Baselines
em classificação
43.15.1
O que são
baselines
?
43.15.2
Por que é necessário comparar classificadores com um
baseline
?
43.15.3
Quais são os principais classificadores
baseline
?
43.15.4
Como o desbalanceamento de classes afeta o
baseline
?
43.15.5
Como usar
baselines
na avaliação de modelos?
43.16
Desbalanceamento de classes
43.16.1
O que é desbalanceamento de classes (
class imbalance
)?
43.16.2
Por que o desbalanceamento é um problema?
43.16.3
Quais são as abordagens mais comuns para lidar com desbalanceamento de classes?
43.16.4
Qual é o impacto do desbalanceamento de classes na calibração de modelos?
44
Redes neurais
44.1
Neurônios artificiais
44.1.1
O que são neurônios artificiais?
44.2
Rede neural artificial
44.2.1
O que é uma rede neural artificial?
44.3
Funções de ativação
44.3.1
Quais são as funções de ativação mais comuns?
44.4
Funções de perda
44.4.1
O que são funções de perda?
44.4.2
Quais são as funções de perda mais comuns?
44.5
Treinamento de redes neurais
44.5.1
O que significa treinar uma rede neural?
44.5.2
O que são os pesos em uma rede neural e por que eles são tratados como parâmetros do modelo?
44.5.3
Como ocorre o ajuste iterativo dos pesos ao longo do treinamento?
44.5.4
Qual é o objetivo formal do treinamento em termos de minimização da função de perda?
44.5.5
O que é o gradiente descendente (
gradient descent
)?
44.5.6
Qual é a interpretação geométrica do gradiente descendente no espaço dos parâmetros?
44.5.7
Por que o gradiente indica a direção de maior redução da função de perda?
44.5.8
O que é o gradiente descendente estocástico (
stochastic gradient descent
, SGD)?
44.5.9
Por que o uso de todo o conjunto de dados em cada atualização pode ser computacionalmente inviável?
44.5.10
O que são
mini-batches
e como eles são utilizados no treinamento?
44.5.11
De que forma o ruído introduzido pelo SGD pode atuar como um regularizador implícito?
44.5.12
O que é uma época (
epoch
) no treinamento de redes neurais?
44.5.13
O que define formalmente uma época durante o processo de treinamento?
44.5.14
Qual é a relação entre época, tamanho do batch e número de atualizações dos pesos?
44.5.15
Como o número de épocas influencia a convergência do modelo e o risco de
overfitting
?
44.6
Espaço de decisão
44.6.1
O que é espaço de decisão?
44.6.2
Como ele é visualizado?
44.7
Redes neurais multicamadas
44.7.1
O que são redes neurais multicamadas?
44.8
Redes neurais profundas
44.8.1
O que são redes neurais profundas?
44.9
Redes neurais convolucionais (Convolutional Neural Networks)
44.9.1
O que são redes neurais convolucionais?
44.9.2
O que é uma convolução?
44.9.3
O que é um filtro convolucional?
44.9.4
Por que convoluções reduzem o número de parâmetros?
45
Inteligência artificial
45.1
Inteligência artificial generativa
45.1.1
O que é IA generativa?
45.1.2
O que são grandes modelos de linguagem (
large language models
, LLM)?
45.1.3
Como funcionam modelos os grandes modelos de linguagem?
45.2
Inteligência artificial explicável (
eXplainable Artificial Intelligence, XAI)
45.2.1
Quais princípios são utilizados para descrever explicabilidade de IA?
45.2.2
Por que explicar modelos de IA?
45.3
Limitações fundamentais de modelos generativos
45.3.1
O que são alucinações em IA generativa?
45.3.2
Por que modelos generativos alucinam?
45.3.3
Alucinações indicam erro do modelo?
45.3.4
Qual a diferença entre erro estatístico e alucinação?
45.3.5
Quais tipos de alucinação são mais comuns?
45.3.6
Por que alucinações são um problema prático?
45.3.7
É possível eliminar completamente as alucinações?
PARTE 9: PLANEJAMENTO DE ESTUDOS
46
Poder estatístico
46.1
Poder do teste
46.1.1
O que é poder do teste?
46.1.2
O que é análise de poder do teste?
46.1.3
Quando realizar a análise de poder do teste?
46.1.4
Por que a análise de poder do teste
post hoc
é inadequada?
46.1.5
O que pode ser realizado ao invés da análise de poder?
46.1.6
Por que o desequilíbrio entre grupos pode ser problemático para o poder do teste?
46.2
Poder observado
46.2.1
Qual é a relação entre poder observado e P-valor?
46.3
Poder de salvaguarda
46.3.1
O que é poder de salvaguarda?
46.3.2
Por que utilizar o poder de salvaguarda?
47
Tamanho da amostra
47.1
Tamanho da amostra
47.1.1
O que é tamanho da amostra?
47.1.2
Por que determinar o tamanho da amostra é importante?
47.1.3
Quais fatores devem ser considerados para determinar o tamanho da amostra?
47.1.4
Quais aspectos éticos estão envolvidos no tamanho da amostra?
47.2
Saturação em pesquisas qualitativas
47.2.1
O que é saturação de dados em pesquisas qualitativas?
47.2.2
Quais tipos de saturação existem?
47.2.3
Quantas entrevistas ou grupos focais são necessários para alcançar saturação?
47.2.4
Quais debates existem sobre o conceito de saturação?
47.2.5
Quais recomendações práticas para tamanho de amostras de estudos qualitativos?
47.3
“Fome de dados”
47.3.1
O que significa “fome de dados”?
47.3.2
Por que a “fome de dados” é relevante?
47.4
Eventos por variável (EPV) em modelos preditivos
47.4.1
Quantos eventos por variável (EPV) são necessários?
47.4.2
O que acontece se não houver eventos suficientes?
47.5
Cálculo do tamanho da amostra
47.5.1
Como calcular o tamanho da amostra?
47.5.2
Como especificar o tamanho do efeito esperado?
47.6
Perdas de amostra
47.6.1
O que é perda de amostra?
47.6.2
Por que a perda de amostra é um problema?
47.6.3
Como evitar perda de amostra?
47.7
Ajustes no tamanho da amostra
47.7.1
Por que ajustar o tamanho da amostra?
47.7.2
Como ajustar para perda amostral?
47.8
Justificativa do tamanho da amostra
47.8.1
Como justificar o tamanho da amostra de um estudo?
47.8.2
Como justificar o tamanho da amostra em estudos qualitativos?
48
Plano de análise
48.1
Plano de análise estatística
48.1.1
O que é plano de análise estatística?
48.1.2
Qual é a relação entre pergunta científica e plano de análise?
48.1.3
Por que a pré-especificação do plano de análise é fundamental?
48.1.4
Como o plano de análise lida com dados perdidos?
48.2
Estimandos
48.2.1
O que são estimandos e por que eles são importantes?
48.2.2
Qual é a diferença entre estimando teórico e estimando empírico?
48.2.3
Por que definir o estimando antes do método estatístico?
48.2.4
Quais componentes devem ser definidos em um estimando?
48.2.5
Qual é a relação entre estimando, estimador e método estatístico?
48.2.6
Como a definição explícita do estimando melhora o Plano de Análise Estatística?
48.2.7
Por que o estimando deve existir fora do modelo estatístico?
48.3
Diretrizes para redação
48.3.1
Quais são as diretrizes para redação de planos de análise estatística?
PARTE 10: DELINEAMENTOS E SÍNTESE DE EVIDÊNCIAS
49
Delineamento de estudos
49.1
Critérios de delineamento
49.1.1
Quais critérios são utilizados para classificar os delineamentos de estudos?
49.2
Alocação
49.2.1
O que é alocação?
49.2.2
Quais são os tipos de alocação?
49.2.3
O que é alocação oculta (allocation concealment)?
49.2.4
A alocação oculta é obrigatória em ensaios clínicos?
49.3
Mascaramento
49.3.1
O que é mascaramento?
49.3.2
Por que o mascaramento é tão importante?
49.3.3
Quem pode ser mascarado?
49.3.4
Quais são os tipos de mascaramento?
49.3.5
Qual é a diferença entre alocação oculta e mascaramento?
49.4
Pareamento
49.4.1
O que é pareamento?
49.5
Aleatorização
49.5.1
O que é aleatorização?
49.5.2
Quais são os métodos de aleatorização?
49.5.3
Quais são as vantagens e desvantagens da aleatorização simples?
49.6
Taxonomia de estudos
49.6.1
Como podem ser classificados os estudos científicos?
50
Simulação computacional
50.1
Simulações computacionais
50.1.1
O que são simulações computacionais?
50.1.2
Por que estudos de simulação devem ser tratados como experimentos científicos?
50.1.3
O que são estudos de simulação estatística?
50.1.4
Qual é o papel dos estudos de simulação em pesquisa científica?
50.1.5
Por que não avaliar métodos estatísticos apenas com dados reais?
50.1.6
Quais são as principais vantagens de estudos de simulação?
50.1.7
Quais são as limitações de estudos de simulação?
50.2
Métodos de simulação
50.2.1
Quais são os elementos fundamentais de um estudo de simulação?
50.2.2
O que é um cenário de simulação?
50.2.3
Quais são os principais elementos para avaliar a qualidade de um modelo de simulação?
50.2.4
Por que é necessário repetir muitas simulações?
50.2.5
Quais boas práticas devem ser seguidas em estudos de modelagem e simulação?
50.3
Método de Monte Carlo
50.3.1
O que é o método de Monte Carlo?
50.3.2
Como escolher a distribuição adequada em um estudo de simulação?
50.4
Avaliação de métodos estatísticos em simulações
50.4.1
Quais critérios são usados para avaliar métodos estatísticos em simulações?
50.4.2
O que é o erro padrão de Monte Carlo?
50.5
Diretrizes para redação
50.5.1
Quais são as diretrizes para redação de estudos de simulação computacional?
51
Estudos observacionais
51.1
Características
51.1.1
Quais são as características de estudos observacionais?
51.2
Diretrizes para redação
51.2.1
Quais são as diretrizes para redação de estudos observacionais?
52
Ciência cidadã
52.1
Introdução
52.1.1
O que é Ciência Cidadã?
52.1.2
Que tipo de dados ela produz?
52.1.3
Como ela difere de amostragem tradicional?
52.1.4
Quais erros são mais comuns?
52.1.5
Quando esses dados são válidos?
52.1.6
Quando não são?
52.1.7
Como documentar metadados?
52.1.8
Que análises fazem sentido?
52.1.9
Como relatar resultados com honestidade?
53
Estudos metodológicos
53.1
Concordância
53.1.1
O que é concordância?
53.1.2
Quais métodos são adequados para análise de concordância de variáveis dicotômicas?
53.1.3
Quais métodos não são adequados para análise de concordância de variáveis dicotômicas?
53.1.4
Quais métodos são adequados para análise de concordância de variáveis categóricas?
53.1.5
Quais métodos são adequados para análise de concordância de variáveis ordinais?
53.1.6
Quais métodos são adequados para análise de concordância de variáveis contínuas?
53.1.7
Quais métodos não são adequados para análise de concordância de variáveis contínuas?
53.1.8
Quais métodos são adequados para modelagem de concordância?
53.2
Confiabilidade
53.2.1
O que é confiabilidade?
53.2.2
Quais métodos são adequados para análise de confiabilidade?
53.3
Diretrizes para redação
53.3.1
Quais são as diretrizes para redação de estudos de propriedades psicométricas?
54
Estudos psicométricos
54.1
Características
54.1.1
O que são propriedades psicométricas?
54.2
Análise fatorial exploratória
54.2.1
O que é análise fatorial exploratória?
54.3
Análise fatorial confirmatória
54.3.1
O que é análise fatorial confirmatória?
54.4
Validade de conteúdo
54.4.1
O que é validade interna?
54.4.2
O que é validade externa?
54.4.3
Que fatores afetam a validade?
54.4.4
Como avaliar a validade de um estudo?
54.5
Validade de face
54.5.1
O que é validade de face?
54.6
Validade do construto
54.6.1
O que é construto?
54.7
Validade fatorial
54.7.1
O que é validade fatorial?
54.8
Validade convergente
54.8.1
O que é validade convergente?
54.9
Validade discriminante
54.9.1
O que é validade discriminante?
54.10
Validade de critério
54.10.1
O que é validade de critério?
54.11
Validade concorrente
54.11.1
O que é concorrente?
54.11.2
O que é validade concorrente?
54.11.3
O que é validade preditiva?
54.12
Responsividade
54.12.1
O que é responsividade?
54.13
Diretrizes para redação
54.13.1
Quais são as diretrizes para redação de estudos de propriedades psicométricas?
55
Desempenho diagnóstico
55.1
Características
55.1.1
Quais são as características de estudos de desempenho diagnóstico?
55.2
Tabelas 2x2
55.2.1
O que é uma tabela de confusão 2x2?
55.2.2
Como analisar o desempenho diagnóstico em tabelas 2x2?
55.2.3
Quais probabilidades caracterizam o desempenho diagnóstico de um teste em tabelas 2x2?
55.3
Tabelas 2x3
55.3.1
O que é uma tabela de confusão 2x3?
55.3.2
Como as regiões POS, BND e NEG são definidas?
55.3.3
Qual é o formato de uma tabela 2×3?
55.3.4
Quais são as medidas básicas na 2×3?
55.3.5
Como escolher os limiares
\(\alpha\)
e
\(\beta\)
?
55.3.6
Quando preferir 3-vias em vez de 2×2?
55.4
Curvas ROC
55.4.1
O que representa a curva ROC?
55.4.2
Quais são os tipos de curva ROC?
55.4.3
Como definir o melhor ponto de corte?
55.4.4
O que é a área sob a curva (AUROC)?
55.4.5
Como calcular a AUC?
55.4.6
Como interpretar a área sob a curva (ROC)?
55.4.7
Por que uma AUC menor que 0.5 está errada?
55.4.8
Como analisar o desempenho diagnóstico em desfechos com distribuição trimodal na população?
55.5
Interpretação da validade de um teste
55.5.1
Que itens devem ser verificados na interpretação de um estudo de validade?
55.6
Diretrizes para redação
55.6.1
Quais são as diretrizes para redação de estudos diagnósticos?
56
n-de-1
56.1
Ensaio n-de-1
56.1.1
O que são ensaios n-de-1?
56.1.2
Quando é apropriado conduzir ensaios n-de-1?
56.1.3
Qual a relevância dos ensaios n-de-1?
56.2
Aspectos metodológicos
56.2.1
Quais são os principais aspectos do delineamento de ensaios n-de-1?
56.2.2
Quantos períodos são usualmente utilizados?
56.2.3
Como é feita a randomização?
56.2.4
Quais perguntas de inferência podem ser respondidas?
56.3
Análise de dados
56.3.1
Como são feitas as análises?
56.3.2
Quais métodos estatísticos têm sido utilizados recentemente?
56.3.3
É adequado utilizar P-valores em ensaios n-de-1?
56.3.4
Como os dados de ensaios n-de-1 podem ser visualizados?
56.3.5
Quais métodos estatísticos são usados na análise?
56.4
Abordagem meta-analítica
56.4.1
Como um conjunto de ensaios n-de-1 pode ser analisado conjuntamente?
56.4.2
Por que a meta-análise com efeitos aleatórios produz intervalos de confiança mais amplos?
56.4.3
Qual é a principal vantagem da abordagem meta-analítica?
56.5
Limitações e cuidados
56.5.1
Quais são os principais desafios dos ensaios n-de-1?
57
Ensaios cruzados
57.1
Características
57.1.1
O que é um ensaio cruzado?
57.1.2
Qual é a principal característica metodológica de ensaios cruzados?
57.1.3
Quais são os principais componentes de um ensaio cruzado?
57.1.4
Quais são as principais vantagens dos ensaios cruzados?
57.1.5
Quais são as limitações dos ensaios cruzados?
57.2
Análise estatística
57.2.1
Quais são as considerações para análise estatística de ensaios cruzados?
57.2.2
Como os efeitos do tratamento são avaliados em ensaios cruzados?
57.2.3
Como verificar a presença de efeitos de
carryover
?
57.2.4
O que fazer quando há evidência de
carryover
?
57.2.5
Como lidar com dados perdidos em ensaios cruzados?
57.3
Extensões do delineamento
57.3.1
Existem variações do ensaio cruzado?
57.4
Diretrizes para redação
57.4.1
Quais são as diretrizes para redação de ensaios cruzados?
58
Ensaios quase-experimentais
58.1
Características
58.1.1
Quais são as características de ensaios quase-experimentais?
58.2
Diretrizes para redação
58.2.1
Quais são as diretrizes para redação de ensaios quase-experimentais?
59
Ensaios experimentais
59.1
Ensaio experimental aleatorizado
59.1.1
Quais são as características de ensaios experimentais aleatorizados?
59.1.2
Quais são as estratégias metodológicas para reduzir vieses?
59.2
Modelos de análise de comparação
59.2.1
Que modelos podem ser utilizados para comparações?
59.3
Comparação na linha de base
59.3.1
O que são dados na linha de base?
59.3.2
O que é comparação entre grupos na linha de base em ensaios experimentais aleatorizados?
59.3.3
Quais são as razões para diferenças entre grupos de tratamento nas (co)variáveis na linha de base?
59.3.4
Para quê comparar grupos na linha de base em ensaios experimentais aleatorizados?
59.3.5
Quais cenários permitem a comparação entre grupos na linha de base em ensaios experimentais aleatorizados?
59.3.6
Por que não se deve comparar grupos na linha de base em ensaios experimentais aleatorizados?
59.3.7
Quais estratégias podem ser adotadas para substituir a comparação entre grupos na linha de base em ensaios experimentais aleatorizados?
59.4
Comparação intragrupos
59.4.1
Por que não se deve comparar intragrupos (pré - pós) em ensaios experimentais aleatorizados?
59.5
Comparação entre grupos
59.5.1
O que é comparação entre grupos em ensaios experimentais aleatorizados?
59.5.2
O que pode ser comparado entre grupos?
59.5.3
Qual é a comparação entre grupos mais adequada em ensaios experimentais aleatorizados?
59.6
Comparação de subgrupos
59.6.1
O que é comparação de subgrupos em ensaios experimentais aleatorizados?
59.6.2
Como realizar a comparação de subgrupos em ensaios experimentais aleatorizados?
59.6.3
Como interpretar a comparação de subgrupos em ensaios experimentais aleatorizados?
59.7
Efeito de interação
59.7.1
Por que analisar o efeito de interação?
59.7.2
Quando usar o termo de interação?
59.8
Ajuste de covariáveis
59.8.1
Quais variáveis devem ser utilizadas no ajuste de covariáveis?
59.8.2
Quais os benefícios do ajuste de covariáveis?
59.8.3
Quais os riscos do ajuste de covariáveis?
59.9
Imputação de dados perdidos
59.9.1
Como lidar com os dados perdidos em desfechos?
59.9.2
Como lidar com os dados perdidos em covariáveis?
59.10
Diretrizes para redação
59.10.1
Quais são as diretrizes para redação de ensaios experimentais?
60
Revisão sistemática
60.1
Tipologia de revisões
60.1.1
O que é a tipologia de revisões?
60.2
Revisão sistemática de literatura
60.2.1
O que é revisão sistemática?
60.3
Tipos de revisão sistemática
60.3.1
Quais são os principais tipos de revisão sistemática?
60.3.2
Quais delineamentos de revisão parecem mas não são revisões sistemáticas?
60.4
Diretrizes para redação
60.4.1
Quais são as diretrizes para revisão sistemática?
61
Meta-análise
61.1
Características
61.1.1
O que é meta-análise?
61.2
Modelos de meta-análise
61.2.1
Quais são os principais modelos de meta-análise?
61.3
Conversão de Medidas em Meta-análises
61.3.1
O que fazer quando os estudos apresentam resultados com diferentes parâmetros?
61.4
Interpretação de efeitos em meta-análise
61.4.1
Como avaliar a variação do tamanho do efeito?
61.4.2
Como avaliar a heterogeneidade entre os estudos?
61.5
Forest plot
61.5.1
O que é um
forest plot
?
61.5.2
Quais são as seis colunas básicas que um
forest plot
geralmente apresenta?
61.5.3
Como diferenciar um desfecho binário de um contínuo em um
forest plot
?
61.5.4
O que representa o ponto central da caixa e o tamanho desta no gráfico?
61.5.5
Qual é o significado da linha vertical do “nenhum efeito”?
61.5.6
Como interpretar o diamante na parte inferior do
forest plot
?
61.5.7
Como a heterogeneidade pode ser avaliada no
forest plot
?
61.5.8
Quais são as interpretações usuais para os valores de heterogeneidade?
61.6
Crosshair
61.6.1
O que um gráfico de cruzes (
crosshair
)?
61.7
Funnel plot
61.7.1
O que é um gráfico de funil (
funnel plot
)?
61.7.2
O que é viés de publicação?
61.7.3
Quais métodos podem ser usados para identificar viés de publicação?
61.7.4
A assimetria do
funnel plot
indica sempre viés de publicação?
61.7.5
O que é
trim and fill
?
61.8
Testes de assimetria do
funnel plot
61.8.1
O que é o teste de Egger?
61.8.2
O que é o teste de Peters?
61.8.3
Quais são as recomendações para testar a assimetria?
61.8.4
Como interpretar os resultados de testes de viés de publicação?
61.9
Diretrizes para redação
61.9.1
Quais são as diretrizes para redação de meta-análises?
62
Revisão guarda-chuva
62.1
Revisão guarda-chuva
62.1.1
O que é revisão guarda-chuva?
62.2
Diretrizes para redação
62.2.1
Quais são as diretrizes para revisão sistemática?
63
Pesquisa qualitativa
63.1
Pesquisa qualitativa
63.1.1
O que é pesquisa qualitativa?
63.2
Diretrizes para redação
63.2.1
Quais são as diretrizes para redação de estudos de propriedades psicométricas?
PARTE 11: COMUNICAÇÃO E RELATO CIENTÍFICO
64
Redação de resultados
64.1
Comunicação de resultados da análise estatística
64.1.1
Qual é o objetivo final da seção de resultados estatísticos?
64.1.2
Como garantir consistência entre métodos e resultados?
64.1.3
Como devo comunicar probabilidades e riscos?
64.1.4
Qual é o formato numérico mais adequado para apresentar riscos?
64.1.5
Como devo apresentar diferenças entre grupos ou intervenções?
64.1.6
Como evitar distorções na interpretação de benefícios e riscos?
64.1.7
Como devo usar gráficos para apresentar probabilidades e efeitos?
64.1.8
O que fazer ao apresentar valores pouco familiares ao leitor?
64.1.9
Posso usar linguagem causal ao descrever resultados?
64.2
Diretrizes e Listas
64.2.1
Quais diretrizes estão disponíveis para redação estatística?
64.2.2
Quais listas de verificação estão disponíveis para redação estatística?
65
Tabelas
65.1
Tabelas
65.1.1
Por que usar tabelas?
65.1.2
Que informações incluir nas tabelas?
65.1.3
Quais são os tipos de tabelas?
65.1.4
Quais são os erros mais comuns de preenchimento de tabelas?
65.2
Tabela 1
65.2.1
O que é a ‘Tabela 1’?
65.2.2
Qual a utilidade da ‘Tabela 1’?
65.2.3
O que é a falácia da ‘Tabela 1’?
65.2.4
Como construir a ‘Tabela 1’?
65.3
Tabela 2
65.3.1
Qual a utilidade da ‘Tabela 2’?
65.3.2
O que é a falácia da ‘Tabela 2’?
65.3.3
Como construir a ‘Tabela 2’?
66
Gráficos
66.1
Análise descritiva
66.2
Visualização efetiva de dados
66.2.1
Por que começar pela mensagem antes do gráfico?
66.2.2
Como escolher a geometria e “mostrar os dados”?
66.3
Gráficos
66.3.1
O que são gráficos?
66.3.2
O que torna um bom gráfico tão poderoso?
66.3.3
Que elementos incluir em gráficos?
66.3.4
Para que servem as barras de erro em gráficos?
66.3.5
Quais são os principais obstáculos para bons gráficos?
66.4
Tipos de gráficos
66.4.1
Quais são os tipos de gráficos para variáveis categóricas?
66.4.2
Quais são os tipos de gráficos para variáveis numéricas?
66.4.3
Quais são os tipos de gráficos para relações entre variáveis?
66.4.4
Quais são os tipos de gráficos para dados longitudinais?
66.4.5
Quais são os tipos de gráficos para séries temporais?
66.4.6
Quais são os tipos de gráficos para avaliação de resposta longitudinal?
66.4.7
Quais são os tipos de gráficos para dados multivariados?
66.4.8
Quais são as melhores práticas na elaboração de gráficos?
66.5
Fluxogramas
66.5.1
Quais são os tipos de fluxogramas?
67
Diretrizes e Listas
67.1
Diretrizes
67.1.1
Quais são as diretrizes para relatórios estatísticos em pesquisas?
67.2
Listas de verificação
67.2.1
Quais são as listas de verificação para relatórios estatísticos em pesquisas?
REFERÊNCIAS
Produção do autor
Artigos em periódicos científicos
Preprints
Resumos publicados em eventos científicos
Livros editorados
Capítulos de livro
Aulas
Programas de computador
Bancos de dados
Outros
Fontes externas
Fontes de informação externas
American Heart Association
American Physiological Society
American Statistical Association
British Medicine Journal
Enhancing the QUality And Transparency Of health Research Network
Journal of the Amercan Medical Association
Nature Publishing Group
Oxford Reference
Royal Statistical Society
Statistics in Medicine
BMC Trials
The Journal of Applied Statistics in the Pharmaceutical Industry
Referências
Publicado com Bookdown
Ciência com R
PARTE 9: PLANEJAMENTO DE ESTUDOS
Definindo poder, tamanho amostral e plano de análise