e-Book | Consultoria
Capa
Dedicatória
Agradecimentos
Apresentação
Sobre o autor
PARTE 1: PENSAMENTO CIENTÍFICO
1
Pensamento probabilístico
1.1
Experimento
1.1.1
O que é um experimento?
1.1.2
O que é um experimento aleatório?
1.2
Espaço amostral e eventos discretos
1.2.1
O que é espaço amostral discreto?
1.2.2
O que é evento discreto?
1.2.3
O que é espaço de eventos discretos?
1.3
Espaço amostral e eventos contínuos
1.3.1
O que é espaço amostral contínuo?
1.3.2
O que é evento contínuo?
1.3.3
O que é espaço de eventos contínuo?
1.4
Probabilidade
1.4.1
O que é probabilidade?
1.4.2
Quais são os axiomas da probabilidade?
1.4.3
Quais as consequências dos axiomas da probabilidade?
1.5
Independência e probabilidade
1.5.1
O que é independência em estatística?
1.5.2
O que é probabilidade marginal?
1.5.3
O que é probabilidade conjunta?
1.5.4
O que é probabilidade condicional?
1.6
Leis dos números anômalos
1.6.1
O que é a lei dos números anômalos?
1.7
Leis dos pequenos números
1.7.1
O que é a lei dos pequenos números?
1.7.2
Quais são as versões da lei dos pequenos números?
1.8
Leis dos grandes números
1.8.1
O que é a lei dos grandes números?
1.8.2
Quais são as versões da lei dos grandes números?
1.9
Teorema central do limite
1.9.1
O que é teorema central do limite?
1.9.2
Quais as condições de validade do teorema central do limite?
1.9.3
Qual a relação entre a lei dos grandes números e o teorema central do limite?
1.9.4
Qual a relevância do teorema central do limite para a análise estatística?
1.10
Regressão para a média
1.10.1
O que é regressão para a média?
1.10.2
Qual a causa da regressão para a média?
1.10.3
Por que detectar o fenômeno de regressão para a média?
1.10.4
Como detectar o fenômeno de regressão para a média?
1.10.5
Como o fenômeno de regressão para a média pode ser evitado?
2
Pensamento estatístico
2.1
Unidade de análise
2.1.1
O que é unidade de análise?
2.1.2
Por que identificar a unidade de análise de um estudo?
2.2
População
2.2.1
O que é população?
2.2.2
O que é representatividade e por que ela importa?
2.3
Amostra
2.3.1
O que é amostra?
2.3.2
Por que usar dados de amostras?
2.4
Amostragem
2.4.1
O que é amostragem?
2.4.2
Quais métodos de amostragem são usados para obter uma amostra da população?
2.4.3
O que é erro de amostragem?
2.5
Reamostragem
2.5.1
O que é reamostragem?
2.5.2
Por que utilizar reamostragem?
2.5.3
Quais procedimentos de reamostragem podem ser realizados?
2.6
Subamostragem
2.6.1
O que é subamostragem?
2.7
Superamostragem
2.7.1
O que é superamostragem?
3
Pensamento metodológico
3.1
Metodologia da pesquisa
3.1.1
O que é metodologia da pesquisa?
3.2
Relação Estatística-Metodologia
3.2.1
Qual a relação entre estatística e metodologia da pesquisa?
3.3
Pesquisa quantitativa vs. qualitativa
3.3.1
O que diferencia pesquisa qualitativa da quantitativa?
3.3.2
Por que essa dicotomia pode ser problemática?
3.4
Pesquisa de métodos mistos
3.4.1
O que é pesquisa de métodos mistos?
3.4.2
Métodos mistos significam misturar paradigmas epistemológicos?
3.4.3
Quais são as principais dimensões do desenho de métodos mistos?
3.4.4
Quais são os delineamentos centrais em pesquisa de métodos mistos?
3.5
Pesquisa multi-métodos
3.5.1
O que é pesquisa multi-métodos?
3.5.2
Qual é o principal objetivo da pesquisa multi-métodos?
3.5.3
Qual a diferença essencial entre métodos mistos e multi-métodos?
3.5.4
Quando utilizar pesquisa multi-métodos?
3.5.5
Quais são as limitações da pesquisa multi-métodos?
3.6
Pesquisa exploratória vs. confirmatória
3.6.1
O que são pesquisas exploratórias e confirmatórias?
3.6.2
Por que a dicotomia é limitada?
3.6.3
Quais são as melhores práticas de transparência?
3.7
Pré-registro
3.7.1
O que é pré-registro?
3.8
Reprodutibilidade e Ciência Aberta
3.8.1
O que é reprodutibilidade?
3.8.2
Por que reprodutibilidade é importante?
3.8.3
Como contribuir para a reprodutibilidade?
3.9
Robustez
3.9.1
O que é robustez?
3.10
Replicabilidade
3.10.1
O que é replicabilidade?
3.11
Generalização
3.11.1
O que é generalização?
3.11.2
O que é generalização estatística?
3.11.3
O que é generalização analítica?
3.11.4
Quais são os mitos mais comuns sobre generalização?
3.11.5
Generalizações são conclusões definitivas?
3.11.6
Como a replicação contribui para a generalização?
3.11.7
Como revisões sistemáticas e meta-análises ampliam a generalização?
4
Pensamento computacional
4.1
R
4.1.1
O que é R?
4.1.2
Por que usar R?
4.1.3
O que é R Markdown?
4.1.4
Que programas de computador podem ser usados para análise estatística com R?
4.2
RStudio
4.2.1
O que é RStudio?
4.3
Scripts
4.3.1
O que são R scripts?
4.3.2
Quais são as melhores práticas na redação de
scripts
?
4.3.3
O que é controle de versão?
4.4
Pacotes
4.4.1
O que são pacotes?
4.5
Manuscritos reproduzíveis
4.5.1
O que são manuscritos reproduzíveis?
4.5.2
Por que usar manuscritos reproduzíveis?
4.5.3
Como manuscritos reproduzíveis contribuem para a ciência?
4.6
Websites reproduzíveis para projetos científicos
4.6.1
O que são websites reproduzíveis para projetos científicos?
4.7
Aplicativos Shiny
4.7.1
O que são Shiny Apps?
4.7.2
Quais são as boas práticas para desenvolver aplicativos Shiny reproduzíveis?
4.8
Compartilhamento
4.8.1
Por que compartilhar scripts?
4.8.2
O que pode ser compartilhado?
4.8.3
Como preparar scripts para compartilhamento?
4.8.4
O que incluir no arquivo README?
4.9
Fluxos de trabalho
4.9.1
O que são fluxos de trabalho reproduzíveis?
5
Letramento estatístico
5.1
Introdução ao letramento estatístico
5.1.1
O que é letramento estatístico?
5.1.2
Por que o letramento estatístico é importante?
5.1.3
Quais são exemplos de armadilhas comuns na interpretação de estatísticas?
5.2
Elementos centrais do letramento estatístico
5.2.1
Quais são os elementos de conhecimento que sustentam o letramento estatístico?
5.2.2
Quais são os cinco elementos de conhecimento que sustentam o letramento estatístico?
5.2.3
Quais são os dois elementos de disposição que facilitam a ação estatisticamente letrada?
5.2.4
Que tipo de perguntas críticas devemos fazer ao interpretar informação estatística?
5.3
Hierarquia de letramento estatístico
5.3.1
Quais são os níveis da hierarquia de letramento estatístico?
5.3.2
Quais são os componentes centrais do letramento estatístico com literacia de dados?
5.4
Habilidades de letramento estatístico baseadas no pensamento crítico
5.4.1
Quais são as habilidades de letramento estatístico?
PARTE 2: AMEAÇAS À QUALIDADE DA EVIDÊNCIA CIENTÍFICA
6
Vieses
6.1
Vieses metodológicos
6.1.1
O que são vieses metodológicos?
6.2
Tipos de vieses metodológicos
6.2.1
Quais são os tipos de vieses metodológicos?
6.3
Diretrizes para redação
6.3.1
Quais são as diretrizes para redação de análises de vieses metodológicos?
7
Falácias estatísticas
7.1
Falácias estatísticas
7.1.1
O que são falácias estatísticas?
7.1.2
O que é a falácia do jogador?
7.1.3
O que é a falácia da mão quente?
8
Paradoxos estatísticos
8.1
Paradoxos
8.1.1
O que são paradoxos estatísticos?
8.1.2
O que é o paradoxo de Abelson?
8.1.3
O que é o paradoxo de Berkson?
8.1.4
O que é o paradoxo de Ellsberg?
8.1.5
O que é o paradoxo de Freedman?
8.1.6
O que é o paradoxo de Hand?
8.1.7
O que é o paradoxo de Kelley?
8.1.8
O que é o paradoxo de Lindley?
8.1.9
O que é o paradoxo de Lord?
8.1.10
O que é o paradoxo de Meng?
8.1.11
O que é o paradoxo de Proebsting?
8.1.12
O que é o paradoxo de Simpson?
8.1.13
O que é o paradoxo de James-Stein?
8.1.14
O que é o paradoxo de Okie?
8.1.15
O que é o paradoxo da acurácia?
8.1.16
O que é o paradoxo do falso positivo?
8.1.17
O que é o paradoxo da caixa de Bertrand?
8.1.18
O que é o paradoxo do elevador?
8.1.19
O que é o paradoxo da amizade?
8.1.20
O que é o paradoxo do menino ou menina?
8.1.21
O que é o paradoxo do aniversário?
8.1.22
O que é o paradoxo do teste surpresa?
8.1.23
O que é o paradoxo do nó da gravata?
8.1.24
O que é o paradoxo de Monty Hall?
8.1.25
O que é o paradoxo da Bela Adormecida?
9
Práticas questionáveis em pesquisa
9.1
Práticas Questionáveis em Pesquisa
9.1.1
O que são práticas questionáveis em pesquisa?
9.1.2
Por que práticas questionáveis em pesquisa devem ser combatidas?
9.2
Prática não intencional e má conduta
9.2.1
Quais são as categorias de práticas questionáveis em pesquisa?
9.2.2
Quais práticas questionáveis podem ocorrer durante o planejamento do estudo?
9.2.3
Quais práticas questionáveis podem ocorrer durante a coleta de dados?
9.2.4
Quais práticas questionáveis podem ocorrer durante a análise dos dados?
9.2.5
Quais práticas questionáveis podem ocorrer durante a apresentação dos resultados?
9.2.6
Quais práticas questionáveis podem ocorrer durante a publicação e revisão por pares?
9.3
Prevenindo práticas questionáveis em pesquisa
9.3.1
Como prevenir práticas questionáveis?
9.4
Reações éticas e institucionais práticas questionáveis em pesquisa
PARTE 3: DO MUNDO REAL À TABELA
10
Variáveis e fatores
10.1
Variáveis
10.1.1
O que são variáveis?
10.1.2
Como são classificadas as variáveis?
10.2
Transformação de variáveis
10.2.1
Por que é importante classificar as variáveis?
10.2.2
O que é transformação de variáveis?
10.2.3
Por que transformar variáveis?
10.2.4
Quais transformações de variáveis podem ser aplicadas?
10.3
Centralização de variáveis (
centering
)
10.3.1
O que é centralização?
10.3.2
Por que centralizar?
10.4
Padronização de variáveis
10.4.1
O que é padronização?
10.4.2
Por que padronizar?
10.4.3
Quais são os métodos de padronização mais comuns?
10.4.4
Quais são as melhores práticas de nomenclatura ao padronizar variáveis?
10.5
Categorização de variáveis contínuas
10.5.1
Por que não é recomendado categorizar variáveis contínuas?
10.5.2
Quais são as alternativas à categorização de variáveis contínuas?
10.6
Dicotomização de variáveis contínuas
10.6.1
O que são variáveis dicotômicas?
10.6.2
Quais argumentos são usados para defender a categorização ou dicotomização de variáveis contínuas?
10.6.3
Por que não é recomendado dicotomizar variáveis contínuas?
10.6.4
Quais cenários legitimam a dicotomização das variáveis contínuas?
10.6.5
Quais métodos são usados para dicotomizar variáveis contínuas?
10.7
Representação de variáveis categóricas
10.7.1
O que são variáveis indicadoras (
dummy variables
)?
10.7.2
Por que variáveis indicadoras são importantes?
10.7.3
Quantas variáveis indicadoras são necessárias para um fator?
10.7.4
O que é o nível de referência?
10.7.5
Por que não se usam k variáveis indicadoras para
\(k\)
níveis?
10.7.6
Variáveis indicadoras são uma forma de dicotomização?
10.7.7
Variáveis indicadoras alteram os dados originais?
10.8
Fatores
10.8.1
O que são fatores?
10.8.2
O que são níveis de um fator?
11
Dados e metadados
11.1
Dados
11.1.1
O que são dados?
11.1.2
O que são dados estruturados?
11.1.3
O que são dados não estruturados?
11.2
Big data
11.2.1
O que são grandes dados (
big data
)?
11.2.2
Quais são as fontes de dados?
11.2.3
O que são dados primários e secundários?
11.2.4
O que são dados quantitativos e qualitativos?
11.3
Metadados
11.3.1
O que são metadados?
11.3.2
Quais são as recomendações para os metadados de um banco de dados?
11.4
Armazenamento de dados
11.4.1
Como armazenar dados?
12
Medidas e instrumentos
12.1
Escalas
12.1.1
O que são escalas?
12.1.2
O que são escalas tipo Likert?
12.2
Medição e Medidas
12.2.1
O que é medição?
12.2.2
O que são medidas diretas?
12.2.3
O que são medidas derivadas?
12.2.4
O que são medidas por teoria?
12.2.5
O que são medidas únicas?
12.2.6
O que são medidas repetidas?
12.2.7
O que são medidas seriadas?
12.2.8
O que são medidas múltiplas?
12.3
Erro de medida
12.3.1
O que são erros de medida?
12.3.2
Quais fontes de variabilidade são comumente investigadas?
12.4
Instrumentos
12.4.1
O que são instrumentos?
12.5
Acurácia e precisão
12.5.1
O que é acurácia?
12.5.2
O que é precisão?
12.6
Viés e variabilidade
12.6.1
Qual é a relação entre viés e variabilidade?
13
Tabulação de dados
13.1
Planilhas eletrônicas
13.1.1
Qual a organização de uma tabela de dados?
13.1.2
Qual a estrutura básica de uma tabela para análise estatística?
13.1.3
O que usar para organizar tabelas para análise computadorizada?
13.1.4
O que não usar para organizar tabelas para análise computadorizada?
13.1.5
O que é recomendado e o que deve ser evitado na organização das tabelas para análise?
14
Vinculação e pareamento de dados
14.1
Vinculação e pareamento de dados
14.1.1
O que é vinculação e pareamento de dados?
14.2
Abordagens de vinculação
14.2.1
Quais são as abordagens de vinculação?
14.3
Erros de vinculação
14.3.1
Quais são os erros comuns na vinculação de dados?
14.4
Controle de qualidade
14.4.1
Como controlar a qualidade da vinculação de dados?
15
Dados perdidos e imputados
15.1
Dados perdidos
15.1.1
O que são dados perdidos?
15.1.2
Qual o problema de um estudo ter dados perdidos?
15.2
Mecanismos geradores de dados perdidos
15.2.1
Quais são os mecanismos geradores de dados perdidos?
15.2.2
Como identificar o mecanismo gerador de dados perdidos em um banco de dados?
15.3
Estratégias para lidar com dados perdidos
15.3.1
Que estratégias podem ser utilizadas na coleta de dados quando há expectativa de perda amostral?
15.3.2
Que estratégias podem ser utilizadas na análise quando há dados perdidos?
15.3.3
Que estratégias podem ser utilizadas na redação de estudos em que há dados perdidos?
15.4
Dados imputados
15.4.1
O que são dados imputados?
15.4.2
Quando a imputação de dados é indicada?
15.4.3
Quais são os métodos de imputação de dados?
16
Distribuições e parâmetros
16.1
Fontes de variabilidade
16.1.1
O que são fontes de variabilidade?
16.1.2
Quais são as principais fontes de variabilidade?
16.1.3
Por que identificar as fontes de variabilidade é importante?
16.2
Distribuições de probabilidade
16.2.1
O que são distribuições de probabilidade?
16.2.2
Como representar distribuições de probabilidade?
16.2.3
Quais características definem uma distribuição?
16.3
Tipos de distribuições
16.3.1
O que são distribuições empíricas?
16.3.2
O que são distribuições teóricas?
16.3.3
O que são distribuições amostrais?
16.3.4
Por que todas as distribuições são condicionais?
16.4
Distribuições univariadas
16.4.1
Quais são as distribuições mais comuns?
16.4.2
Quais são as funções de uma distribuição?
16.4.3
O que é a distribuição normal?
16.4.4
Que métodos podem ser utilizados para identificar a normalidade da distribuição?
16.4.5
O que são distribuições não-normais?
16.5
Distribuições multivariadas
16.5.1
O que são distribuições multivariadas?
16.6
Parâmetros
16.6.1
O que são parâmetros?
16.6.2
Que parâmetros podem ser estimados?
16.7
Tendência central
16.7.1
Que parâmetros de tendência central podem ser estimados?
16.7.2
Como escolher o parâmetro de tendência central?
16.8
Dispersão
16.8.1
Que parâmetros de dispersão podem ser estimados?
16.8.2
Como escolher o parâmetro de dispersão?
16.8.3
O que é a correção de Bessel para variância?
16.8.4
Por que a correção de Bessel para variância é importante?
16.9
Proporção
16.9.1
Que parâmetros de proporção podem ser estimados?
16.10
Extremos
16.10.1
Que parâmetros extremos podem ser estimados?
16.11
Erro
16.11.1
Que parâmetros de erro podem ser estimados?
16.12
Distribuição
16.12.1
Que parâmetros de distribuição podem ser estimados?
16.13
Parâmetros robustos
16.13.1
O que são parâmetros robustos?
16.13.2
Por que utilizar parâmetros robustos?
16.13.3
O que é ponto de quebra?
16.13.4
Que parâmetros robustos podem ser estimados?
17
Dados anonimizados e sintéticos
17.1
Dados anonimizados
17.1.1
O que são dados anonimizados?
17.1.2
Por que anonimização perfeita não existe?
17.1.3
Quais são os principais tipos de ataques contra dados anonimizados?
17.1.4
Como anonimizar os dados de um banco?
17.1.5
Quais são as limitações das técnicas de anonimização?
17.1.6
Qual é o equilíbrio entre privacidade e utilidade?
17.2
Dados sintéticos
17.2.1
O que são dados sintéticos?
17.2.2
Como dados sintéticos podem ser usados em
digital twins
?
PARTE 4: ANÁLISES DESCRITIVAS E EXPLORATÓRIAS
18
Análise inicial de dados
18.1
Análise inicial de dados
18.1.1
O que é análise inicial de dados?
18.1.2
Como conduzir uma análise inicial de dados?
19
Análise exploratória de dados
19.1
Análise exploratória de dados
19.1.1
O que é análise exploratória de dados?
19.1.2
Quais são os objetivos centrais da análise exploratória de dados?
19.1.3
Por que conduzir a análise exploratória de dados?
19.2
Quarteto de Anscombe
19.2.1
O que é o Quarteto de Anscombe?
19.3
Ingredientes da análise exploratória de dados
19.3.1
Quais são os principais elementos que compõem a análise exploratória de dados?
19.3.2
Quais etapas constituem a análise exploratória de dados?
20
Análise descritiva
20.1
Análise descritiva
20.1.1
O que é análise descritiva?
20.1.2
Como apresentar os resultados descritivos?
20.2
Apresentação de resultados numéricos
20.2.1
O que são casas decimais?
20.2.2
O que são dígitos significativos?
20.2.3
Como arredondar dados numéricos?
21
Análise robusta
21.1
Raciocínio inferencial robusto
21.1.1
O que é análise robusta?
21.1.2
Por que usar análise robusta?
21.1.3
Quando usar análise robusta?
21.1.4
Por que métodos robustos são preferíveis?
21.2
Valores discrepantes
21.2.1
O que são valores discrepantes (
outliers
)?
21.2.2
Quais são os tipos de valores discrepantes?
21.2.3
Por que é importante avaliar valores discrepantes?
21.2.4
Como detectar valores discrepantes?
21.2.5
Quais são os métodos para detectar valores discrepantes?
21.2.6
Quais testes são apropriados para detectar valores discrepantes?
21.2.7
Como manejar os valores discrepantes?
21.2.8
Como conduzir análises com valores discrepantes?
21.2.9
Como lidar com
outliers
na análise exploratória de dados?
21.3
Valores influentes
21.3.1
O que são valores influentes?
21.3.2
O que é função de influência?
21.3.3
O que é ponto de quebra?
21.3.4
Como detectar valores influentes?
21.4
Métodos robustos de tratamento de
outliers
21.4.1
O que é Winsorização?
21.4.2
Quais são as alternativas à Winsorização?
22
Análise qualitativa
22.1
Análise qualitativa
22.2
Representação de texto
22.2.1
O que é tokenização?
22.2.2
Modelagem com N-gramas
22.2.3
O que são n-gramas?
PARTE 5: ANÁLISES INFERENCIAIS
23
Análise inferencial
23.1
Raciocínio inferencial
23.1.1
O que é análise inferencial?
23.1.2
Quais são os tipos de raciocínio inferencial?
23.1.3
Quais são as questões fundamentais da análise inferencial?
23.2
Hipóteses científicas
23.2.1
O que é hipótese científica?
23.2.2
Quais são as fontes de ideias para gerar hipóteses científicas?
23.3
Hipóteses estatísticas
23.3.1
O que é hipótese nula?
23.3.2
O que é hipótese alternativa?
23.3.3
Qual hipótese está sendo testada?
23.4
Testes de hipóteses
23.4.1
Quais são os tipos de teste de hipóteses?
23.4.2
O que são testes unicaudais e bicaudais?
23.4.3
O que reportar após um teste de hipótese?
23.5
Intervalos de confiança e raciocínio de longo prazo
23.5.1
O que é um intervalo de confiança?
23.5.2
Intervalos de confiança e a lógica frequentista
23.5.3
O que um intervalo de confiança não representa
23.5.4
Relação entre intervalos de confiança e testes de hipóteses
23.5.5
Por que intervalos de confiança são centrais na inferência científica
23.6
Comparações múltiplas
23.6.1
O que é uma família de hipóteses?
23.6.2
O que são testes
ad hoc
e
post hoc
?
23.6.3
Como ajustar a análise inferencial para hipóteses múltiplas?
23.7
Inferência visual
23.7.1
O que é inferência visual?
23.7.2
Por que usar intervalos de confiança para inferência visual?
23.7.3
Como interpretar intervalos de confiança em uma figura?
23.8
Interpretação de análise inferencial
23.8.1
Como interpretar uma análise inferencial?
23.8.2
O que são resultados positivos” e “negativos” (inconclusivos) em teste de hipótese?
23.8.3
Qual a importância de resultados “negativos”?
23.8.4
Resultados inconclusivos: Ausência de evidência ou evidência de ausência?
23.9
Erros de inferência I, II, S e M
23.9.1
O que são erros de inferência estatística?
23.9.2
O que são erros Tipo I e Tipo II?
23.9.3
O que são erros Tipo S e Tipo M?
24
Suposições inferenciais
24.1
Suposições gerais em análises inferenciais
24.1.1
Quais são as suposições ao nível dos dados (condicionais ao modelo)?
24.1.2
Quais são as suposições ao nível do modelo?
24.1.3
Quais são as suposições ao nível do estudo?
24.2
Suposições implícitas e explícitas nos testes
24.2.1
Quais suposições implícitas são feitas nos testes estatísticos?
24.2.2
Quais suposições explícitas são feitas nos testes estatísticos?
24.3
Suposições causais que conectam dados observados a efeitos causais
24.3.1
Quais são as suposições causais que conectam dados observados a efeitos causais?
24.3.2
Qual a relação dessas suposições com as demais suposições inferenciais?
24.4
Diagnóstico e verificação
24.4.1
O que fazer quando suposições gerais falham?
24.4.2
O que fazer quando as suposições causais falham?
24.4.3
Como avaliar as suposições de uma regressão?
24.4.4
Como avaliar a independência entre variáveis?
24.5
Normalidade
24.5.1
Devemos testar as suposições de normalidade?
24.6
Escolha entre métodos paramétricos e não paramétricos
24.6.1
O que é uma análise paramétrica?
24.6.2
O que é uma análise não paramétrica?
24.6.3
Por que as análises paramétricas são preferidas?
25
P-valor
25.1
P-valor
25.1.1
O que é o P-valor?
25.1.2
O que o P-valor não é?
25.2
Significância estatística
25.2.1
O que é significância estatística?
25.3
Interpretação do P-valor
25.3.1
Como interpretar o P-valor?
25.3.2
Existe uma crítica lógica à significância estatística?
25.3.3
O que é “prova probabilística por contradição”?
25.3.4
Qual é o equívoco central?
25.3.5
O que isso implica para a interpretação do P-valor?
25.3.6
Qual a origem do ‘P<0,05’?
25.3.7
Quais são os complementos ou alternativas ao P-valor?
25.4
P-valor de 2ª geração
25.4.1
O que é o P-valor de 2ª geração?
25.4.2
Como definir a hipótese nula intervalar e
\(\delta\)
?
25.4.3
Como calcular o SGPV?
25.4.4
Como interpretar o SGPV?
25.4.5
Relação com testes de equivalência
25.4.6
Propriedades frequenciais e múltiplas comparações
25.5
Distribuição de confiança
25.5.1
O que é distribuição de confiança?
25.5.2
Como interpretar a distribuição de confiança?
26
Tamanho do efeito
26.1
Tamanho do efeito
26.1.1
O que é o tamanho do efeito?
26.2
Tipos de tamanho do efeito
26.2.1
Como interpretar um tamanho do efeito?
26.2.2
O que é a diferença de média bruta?
26.2.3
Correlações podem ser consideradas tamanhos de efeito?
26.2.4
O que é o
\(q\)
de Cohen?
26.2.5
O que o
\(g\)
no teste do sinal?
26.2.6
O que é o
\(h\)
de Cohen?
26.2.7
O que representa o tamanho de efeito
\(w\)
?
26.2.8
O que é o tamanho de efeito
\(f\)
em ANOVA?
26.2.9
O que é o tamanho de efeito
\(f^2\)
em regressão?
26.2.10
O que é a estatística
\(\Lambda\)
de Wilks na MANOVA?
26.2.11
Como escolher o tamanho de efeito adequado?
26.3
Conversão entre tamanhos do efeito
26.3.1
Como converter um tamanho de efeito em outro?
26.4
Efeitos bruto e padronizado
26.4.1
O que é efeito bruto?
26.4.2
O que é efeito padronizado?
27
Análise preditiva
27.1
Predição
27.1.1
O que são predições?
27.1.2
Como árvores de decisão são usadas para predição?
27.2
Interpretação e aplicação
27.2.1
Quais são as implicações do uso de árvores de decisão em predição?
27.3
Análise de curva de decisão
27.3.1
O que é a análise de curva de decisão?
27.3.2
O que significam os eixos da curva de decisão?
27.3.3
Como interpretar o benefício líquido?
27.3.4
Por que é importante comparar sempre com “tratar todos” e “tratar nenhum”?
27.3.5
Quais são os limites e usos da análise de curva de decisão?
27.3.6
A análise de curva de decisão pode ser conduzida sem dados individuais de pacientes?
27.3.7
Como funciona o cálculo do benefício líquido?
28
Análise causal
28.1
Causalidade
28.1.1
O que é análise causal?
28.1.2
Quais os dois grandes tipos de causalidade?
28.2
Abordagens filosóficas e estatísticas da causalidade
28.2.1
O que é realidade causal?
28.2.2
Por que estatísticos historicamente evitaram falar em causalidade?
28.3
Ilusões de causalidade
28.3.1
O que são ilusões de causalidade?
28.3.2
Quais fatores favorecem a ilusão?
28.3.3
Como reduzir ilusões de causalidade?
28.4
Inferência causal em estudos observacionais
28.4.1
Como diferenciar associação de causalidade?
28.4.2
Quais critérios ajudam a sustentar inferência causal?
28.4.3
Qual o papel dos caminhos causais (DAGs)?
28.4.4
Como lidar com confundimento residual?
28.5
Critérios de Hill para inferência causal
28.5.1
Quais são os nove critérios?
28.5.2
Hill propôs um checklist rígido?
28.6
Críticas contemporâneas aos critérios de Hill
28.6.1
Qual critério é indispensável?
28.6.2
A força da associação garante causalidade?
28.6.3
A consistência é indispensável?
28.6.4
O critério da especificidade é válido?
28.6.5
O gradiente biológico (dose–resposta) é confiável?
28.6.6
A plausibilidade e a coerência são objetivas?
28.6.7
Evidência experimental é decisiva?
28.6.8
Analogia é útil?
28.7
Visão atual sobre os critérios de Hill
28.7.1
Como os critérios de Hill foram revisitados?
28.7.2
Quais mudanças na interpretação?
28.8
Linguagem causal em estudos observacionais
28.8.1
Quais são as principais recomendações para relatar causalidade?
28.9
Efeitos diretos e indiretos
28.9.1
Como distinguir efeitos diretos de indiretos?
28.10
O papel do tempo e a causalidade dinâmica
28.10.1
O que é causalidade de Granger?
28.10.2
Por que o tempo é essencial na análise causal?
28.11
Diagrama acíclico direcionado (DAG)
28.11.1
O que são DAGs?
28.11.2
Quais são os padrões causais básicos?
28.11.3
Quais são as regras básicas para análise causal?
28.11.4
Quais são as regras básicas para ajuste?
PARTE 6: RELAÇÕES ENTRE VARIÁVEIS
29
Descrição
29.1
Análise de descrição
29.1.1
O que é análise de descrição de dados?
29.2
Estimação
29.2.1
O que é estimativa?
29.2.2
O que é estimativa pontual?
29.2.3
O que é estimativa de intervalar?
29.2.4
O que é estimativa de parâmetro?
30
Comparação
30.1
Teste
t
de Student
30.2
Teste
t
de Welch
30.3
Teste de Mann-Whitney
30.4
Teste de Wilcoxon
30.5
Análise de variância
30.6
Análise de variância (Welch)
30.7
Análise de variância (Kruskal-Wallis)
31
Associação
31.1
Testes de Qui-quadrado (
\(\chi^2\)
)
301,302
31.2
Teste exato (condicional) de Fisher
301,302
31.3
Teste exato (incondicional) de Barnard
303
31.4
Teste de McNemar
31.5
Teste
Q
de Cochran
31.6
Teste de Cochran–Armitage
31.7
Razão de changes (
\(OR\)
) e risco relativo (
\(RR\)
)
32
Correlação
32.1
Coeficiente de correlação de Pearson (
\(r\)
) @ref(eq:pearson).
304,305
32.2
Coeficiente de correlação ponto-bisserial (
\(r_{s}\)
) @ref(eq:biserial).
304
32.3
Coeficiente de correlação de Spearman (
\(\rho\)
) @ref(eq:spearman).
304,305
32.4
Coeficiente de Kendall (
\(\tau\)
) @ref(eq:kendall).
304,305
32.5
Coeficiente de Cramér (
\(V\)
) @ref(eq:cramer).
REF?
32.6
Coeficiente de Sheperd (
\(\phi\)
) @ref(eq:sheperd).
REF?
32.7
Coeficiente de correlação tetracórica
\(r_{tet}\)
.
310,311
32.8
Coeficiente de correlação policórica
\(r_{pol}\)
.
311
32.9
Coeficiente de correlação ponto-bisserial
\(r_{pb}\)
.
32.10
Coeficiente de correlação bisserial
\(r_{s}\)
.
311
33
Redes
33.1
Análise de redes
33.1.1
O que é análise de rede?
33.1.2
Por que a análise de redes é útil em pesquisa científica?
33.1.3
Quais são as limitações da análise de redes?
33.2
Matriz de incidência
33.2.1
O que é uma matriz de incidência?
33.3
Elementos da rede
33.3.1
Quais são os principais elementos de uma rede?
33.3.2
Como as redes podem ser classificadas?
33.3.3
O que define a posição dos nodos em um grafo de rede?
33.4
Tipos de redes
33.4.1
Quais são os principais tipos de redes estatísticas?
33.4.2
Como reduzir associações espúrias em redes?
33.5
Métricas de rede
33.5.1
O que são medidas de centralidade?
34
Regressão
34.1
Análise de regressão
34.1.1
O que é regressão?
34.1.2
Quais são os algoritmos de regressão?
34.2
Estruturas de análise de regressão
34.2.1
O que são análises de regressão simples?
34.2.2
O que são análises de regressão multivariável?
34.2.3
O que são análises de regressão multivariada?
34.2.4
O que são análises de regressão segmentada?
34.3
Tipos e famílias de regressão
34.3.1
O que são modelos de regressão linear?
34.3.2
O que são modelos de regressão polinomial?
34.3.3
O que são modelos de regressão não-linear?
34.3.4
O que são modelos de regressão logística?
34.3.5
O que são modelos de regressão multinomial?
34.3.6
O que são modelos de regressão ordinal?
34.3.7
O que são modelos de regressão de Poisson?
34.3.8
O que são modelos de regressão binomial negativa?
34.3.9
O que são modelos de regressão Gama?
34.3.10
O que são modelos de regressão com efeitos mistos?
34.3.11
O que são modelos de regressão com efeitos mistos generalizados?
34.3.12
O que são modelos de regressão ridge?
34.3.13
O que são modelos de regressão LASSO?
34.4
Preparação de variáveis
34.4.1
Como preparar as variáveis categóricas para análise de regressão?
34.4.2
Por que é comum escolher a categoria mais frequente como referência em modelos epidemiológicos?
34.5
Colinearidade
34.5.1
O que é colinearidade?
34.5.2
Como identificar colinearidade na matriz de correlação?
34.6
Multicolinearidade
34.6.1
O que é multicolinearidade?
34.6.2
Como diagnosticar multicolinearidade de forma quantitativa?
34.6.3
O que fazer em caso de multicolinearidade elevada?
34.7
Redução de dimensionalidade
34.7.1
Correlação bivariada pode ser usada para seleção de variáveis em modelos de regressão multivariável?
34.7.2
Variáveis sem significância estatística devem ser excluídas do modelo final?
34.7.3
Por que métodos de regressão gradual não são recomendados para seleção de variáveis em modelos de regressão multivariável?
34.7.4
O que pode ser feito para reduzir o número de variáveis candidatas em modelos de regressão multivariável?
34.7.5
Quando devemos forçar uma variável no modelo?
34.8
Seleção de variáveis em regressão
34.8.1
O que é seleção de variáveis em regressão?
34.8.2
Quais são os principais critérios de informação usados na seleção de variáveis?
34.8.3
Quais algoritmos podem ser usados para seleção automática?
35
Mediação
35.1
Análise de mediação
35.1.1
O que é análise de mediação?
PARTE 7: MODELAGEM
36
Modelos
36.1
Modelos
36.1.1
O que são modelos?
36.1.2
O que é modelagem?
36.1.3
Por que a escolha do modelo é complexa?
36.1.4
O que diferencia modelos clássicos e modernos em predição?
36.2
Modelos estocásticos
36.2.1
O que são modelos estocásticos?
36.2.2
O que são cadeias de Markov?
36.3
Efeito fixo
36.3.1
O que é efeito fixo?
36.4
Efeito aleatório
36.4.1
O que é efeito aleatório?
36.5
Efeito misto
36.5.1
O que é efeito misto?
36.6
Efeito principal
36.6.1
O que é efeito principal?
36.7
Efeito de interação
36.7.1
O que é efeito de interação?
36.8
Efeito de mediação
36.8.1
O que é um mediador de efeito?
36.8.2
O que é efeito de mediação?
36.8.3
O que é efeito direto?
36.8.4
O que é efeito indireto?
36.8.5
O que é efeito total?
36.9
Efeito de modificação
36.9.1
O que é um modificador de efeito?
36.9.2
O que é efeito de modificação?
36.10
Preditores e desfechos
36.10.1
O que são desfechos de um modelo?
36.10.2
O que são preditores de um modelo?
36.10.3
Como selecionar preditores para um modelo?
36.11
Desempenho e estabilidade de modelos
36.11.1
Como avaliar o desempenho dos modelos?
36.11.2
Qual modelo alcança estabilidade mais rapidamente?
36.12
Comparação de modelos
36.12.1
Como comparar modelos estatísticos?
36.12.2
Como comparar modelos de aprendizagem de máquina?
36.13
Avaliação de modelos
36.13.1
Como avaliar a qualidade de ajuste de um modelo?
36.14
Validação de modelos
36.14.1
Como validar modelos estatísticos?
36.15
Calibração de modelos
36.15.1
Como calibrar modelos estatísticos?
37
Modelagem estrutural
37.1
Modelos estruturais
37.1.1
O que é modelagem de equações estruturais (SEM)?
37.1.2
Em que a SEM difere de outras abordagens estatísticas?
37.2
Variáveis latentes
37.2.1
O que é uma variável latente?
37.2.2
O que é análise fatorial confirmatória (CFA)?
37.3
Aplicações avançadas
37.3.1
O que é modelo de curva de crescimento latente (LGC)?
37.3.2
O que é SEM Bayesiana?
37.3.3
O que é PLS-SEM?
37.3.4
O que caracteriza a PLS-SEM dentro da família da SEM?
37.3.5
Quando a PLS-SEM deve ser considerada?
37.4
Ajuste e avaliação do modelo
37.4.1
Quais são os principais índices de ajuste em SEM?
37.5
Problemas comuns na aplicação de SEM
37.5.1
Quais são problemas frequentes na aplicação de SEM?
37.5.2
Por que a especificação do modelo é crítica em SEM?
38
Modelagem temporal
38.1
Modelos temporais
38.1.1
O que são modelos temporais?
38.1.2
Por que modelos temporais são importantes?
38.2
Estrutura temporal dos dados
38.2.1
O que é dependência temporal?
38.2.2
O que é autocorrelação?
38.3
Modelos lineares e não lineares
38.3.1
O que são modelos temporais lineares?
38.3.2
O que são modelos temporais não lineares?
38.3.3
Por que distinguir linearidade de não linearidade é difícil?
38.4
Testes de não linearidade
38.4.1
Como testar não linearidade em séries temporais?
38.4.2
O que é o método de dados substitutos?
38.4.3
Como funciona o método de dados substitutos?
38.4.4
O que é significância nesse contexto?
38.5
Hipóteses em modelos temporais
38.5.1
O que é uma hipótese nula em séries temporais?
38.5.2
Quais hipóteses nulas podem ser usadas?
38.6
Estatísticas em séries temporais
38.6.1
O que são estatísticas discriminantes?
38.6.2
Quais estatísticas podem ser usadas?
38.7
Limitações dos modelos temporais
38.7.1
Quais são as limitações dos modelos temporais?
38.8
Validação de modelos temporais
38.8.1
Como validar modelos temporais?
39
Modelagem espacial
39.1
Modelos espaciais
39.1.1
O que são modelos espaciais?
40
Modelagem de sobrevida
40.1
Análise de sobrevida
40.1.1
O que é análise de sobrevida?
40.1.2
Quando usar análise de sobrevida?
40.2
Eventos
40.2.1
O que caracteriza um “evento” em análise de sobrevida?
40.3
Dados censurados
40.3.1
O que são dados censurados?
40.3.2
Quais são os tipos de censura de dados?
40.4
Medidas de associação em análise de sobrevida
40.4.1
O que é a função de sobrevida?
40.4.2
O que é a função de risco?
40.4.3
O que é a razão de risco (
hazard ratio
)?
40.4.4
Qual é a diferença entre modelos de Kaplan–Meier e Cox?
40.4.5
O que é o tempo médio de sobrevida restrito?
40.5
Modelo de Kaplan–Meier
40.5.1
O que é a curva de Kaplan–Meier?
40.5.2
Como interpretar as curvas de Kaplan–Meier?
40.6
Modelos de Cox
40.6.1
O que é o modelo de Cox?
40.6.2
Como interpretar o coeficiente do modelo de Cox?
PARTE 8: REPRESENTAÇÃO, APRENDIZADO DE MÁQUINA E INTELIGÊNCIA ARTIFICIAL
41
Representações
41.1
Representações de dados e extração de atributos
41.1.1
Como representar texto como vetores?
41.1.2
O que é
one-hot
,
multi-hot
e
count encoding
?
42
Aprendizado de máquina
42.1
Aprendizado de máquina
42.1.1
O que é aprendizado de máquina?
42.2
Tipos de aprendizado
42.2.1
O que é aprendizado supervisionado?
42.2.2
O que é aprendizado não supervisionado?
42.2.3
O que é aprendizado por reforço?
42.2.4
Quais são os limites do progresso em classificadores supervisionados?
42.2.5
Quais problemas práticos limitam a generalização de classificadores?
42.3
Fluxo de desenvolvimento de modelos
42.3.1
Qual é o fluxo típico de desenvolvimento de modelos de aprendizado de máquina?
42.3.2
O que são conjuntos de treinamento, validação e teste?
42.3.3
O que são hiperparâmetros?
42.4
Principais algoritmos
42.4.1
Quais são os principais algoritmos de aprendizado de máquina?
42.4.2
Por que estudos comparativos entre classificadores podem ser enganosos?
42.5
Regressão logística
42.5.1
O que é regressão logística?
42.5.2
Por que utilizar regressão logística em problemas de classificação?
42.6
Máquina de vetores de suporte
42.6.1
O que são máquinas de vetores de suporte?
42.7
K-nearest neighbours
42.7.1
O que é
K-nearest neighbours
?
42.8
Árvores de decisão
42.8.1
O que são árvores de decisão?
42.8.2
Quais são os principais usos de árvores de decisão?
42.8.3
Quais são os componentes básicos de uma árvore de decisão?
42.8.4
Como árvores de decisão realizam as divisões nos dados?
42.8.5
Como funcionam
splitting
,
stopping
e
pruning
?
42.8.6
Quais são as vantagens e limitações de árvores de decisão?
42.8.7
Espaço de decisão em árvores de decisão vs. regressão logística
42.9
Random forests
42.9.1
O que são
random forests
?
42.10
Ensemble
42.10.1
O que são
ensemble
?
42.11
K-means Clustering
42.11.1
O que é
K-means clustering
?
42.11.2
Existe um número “ótimo” de
clusters
?
42.11.3
Como escolher o número de
clusters
?
42.11.4
Por que o método do “cotovelo” pode ser problemático?
42.12
Análise de componentes principais
42.12.1
O que é análise de componentes principais?
42.13
Métricas de distância e similaridade
42.13.1
O que é uma métrica?
42.13.2
Quais são as principais métricas?
42.13.3
Como escolher a métrica adequada?
42.13.4
Quais métricas são indicadas para avaliar modelos preditivos?
42.13.5
Quais métricas são consideradas inadequadas ou problemáticas?
42.14
Avaliação de modelos de classificação
42.14.1
Por que é importante avaliar o desempenho de um modelo de classificação?
42.14.2
O que é uma matriz de confusão 2x2?
42.14.3
Como interpretar uma matriz de confusão 2x2?
42.14.4
Quais métricas caracterizam o desempenho de um classificador?
42.15
Baselines
em classificação
42.15.1
O que são
baselines
?
42.15.2
Por que é necessário comparar classificadores com um
baseline
?
42.15.3
Quais são os principais classificadores
baseline
?
42.15.4
Como o desbalanceamento de classes afeta o
baseline
?
42.15.5
Como usar
baselines
na avaliação de modelos?
42.16
Desbalanceamento de classes
42.16.1
O que é desbalanceamento de classes (
class imbalance
)?
42.16.2
Por que o desbalanceamento é um problema?
42.16.3
Quais são as abordagens mais comuns para lidar com desbalanceamento de classes?
42.16.4
Qual é o impacto do desbalanceamento de classes na calibração de modelos?
43
Redes neurais
43.1
Neurônios artificiais
43.1.1
O que são neurônios artificiais?
43.2
Rede neural artificial
43.2.1
O que é uma rede neural artificial?
43.3
Funções de ativação
43.3.1
Quais são as funções de ativação mais comuns?
43.4
Funções de perda
43.4.1
O que são funções de perda?
43.4.2
Quais são as funções de perda mais comuns?
43.5
Treinamento de redes neurais
43.5.1
O que significa treinar uma rede neural?
43.5.2
O que são os pesos em uma rede neural e por que eles são tratados como parâmetros do modelo?
43.5.3
Como ocorre o ajuste iterativo dos pesos ao longo do treinamento?
43.5.4
Qual é o objetivo formal do treinamento em termos de minimização da função de perda?
43.5.5
O que é o gradiente descendente (
gradient descent
)?
43.5.6
Qual é a interpretação geométrica do gradiente descendente no espaço dos parâmetros?
43.5.7
Por que o gradiente indica a direção de maior redução da função de perda?
43.5.8
O que é o gradiente descendente estocástico (
stochastic gradient descent
, SGD)?
43.5.9
Por que o uso de todo o conjunto de dados em cada atualização pode ser computacionalmente inviável?
43.5.10
O que são
mini-batches
e como eles são utilizados no treinamento?
43.5.11
De que forma o ruído introduzido pelo SGD pode atuar como um regularizador implícito?
43.5.12
O que é uma época (
epoch
) no treinamento de redes neurais?
43.5.13
O que define formalmente uma época durante o processo de treinamento?
43.5.14
Qual é a relação entre época, tamanho do batch e número de atualizações dos pesos?
43.5.15
Como o número de épocas influencia a convergência do modelo e o risco de
overfitting
?
43.6
Espaço de decisão
43.6.1
O que é espaço de decisão?
43.6.2
Como ele é visualizado?
43.7
Redes neurais multicamadas
43.7.1
O que são redes neurais multicamadas?
43.8
Redes neurais profundas
43.8.1
O que são redes neurais profundas?
43.9
Redes neurais convolucionais (Convolutional Neural Networks)
43.9.1
O que são redes neurais convolucionais?
43.9.2
O que é uma convolução?
43.9.3
O que é um filtro convolucional?
43.9.4
Por que convoluções reduzem o número de parâmetros?
44
Inteligência artificial
44.1
Inteligência artificial generativa
44.1.1
O que é IA generativa?
44.1.2
O que são grandes modelos de linguagem (
large language models
, LLM)?
44.1.3
Como funcionam modelos os grandes modelos de linguagem?
44.2
Inteligência artificial explicável (
eXplainable Artificial Intelligence, XAI)
44.2.1
Quais princípios são utilizados para descrever explicabilidade de IA?
44.2.2
Por que explicar modelos de IA?
44.3
Limitações fundamentais de modelos generativos
44.3.1
O que são alucinações em IA generativa?
44.3.2
Por que modelos generativos alucinam?
44.3.3
Alucinações indicam erro do modelo?
44.3.4
Qual a diferença entre erro estatístico e alucinação?
44.3.5
Quais tipos de alucinação são mais comuns?
44.3.6
Por que alucinações são um problema prático?
44.3.7
É possível eliminar completamente as alucinações?
PARTE 9: PLANEJAMENTO DE ESTUDOS
45
Poder estatístico
45.1
Poder do teste
45.1.1
O que é poder do teste?
45.1.2
O que é análise de poder do teste?
45.1.3
Quando realizar a análise de poder do teste?
45.1.4
Por que a análise de poder do teste
post hoc
é inadequada?
45.1.5
O que pode ser realizado ao invés da análise de poder?
45.1.6
Por que o desequilíbrio entre grupos pode ser problemático para o poder do teste?
45.2
Poder observado
45.2.1
Qual é a relação entre poder observado e P-valor?
45.3
Poder de salvaguarda
45.3.1
O que é poder de salvaguarda?
45.3.2
Por que utilizar o poder de salvaguarda?
46
Tamanho da amostra
46.1
Tamanho da amostra
46.1.1
O que é tamanho da amostra?
46.1.2
Por que determinar o tamanho da amostra é importante?
46.1.3
Quais fatores devem ser considerados para determinar o tamanho da amostra?
46.1.4
Quais aspectos éticos estão envolvidos no tamanho da amostra?
46.2
Saturação em pesquisas qualitativas
46.2.1
O que é saturação de dados em pesquisas qualitativas?
46.2.2
Quais tipos de saturação existem?
46.2.3
Quantas entrevistas ou grupos focais são necessários para alcançar saturação?
46.2.4
Quais debates existem sobre o conceito de saturação?
46.2.5
Quais recomendações práticas para tamanho de amostras de estudos qualitativos?
46.3
“Fome de dados”
46.3.1
O que significa “fome de dados”?
46.3.2
Por que a “fome de dados” é relevante?
46.4
Eventos por variável (EPV) em modelos preditivos
46.4.1
Quantos eventos por variável (EPV) são necessários?
46.4.2
O que acontece se não houver eventos suficientes?
46.5
Cálculo do tamanho da amostra
46.5.1
Como calcular o tamanho da amostra?
46.5.2
Como especificar o tamanho do efeito esperado?
46.6
Perdas de amostra
46.6.1
O que é perda de amostra?
46.6.2
Por que a perda de amostra é um problema?
46.6.3
Como evitar perda de amostra?
46.7
Ajustes no tamanho da amostra
46.7.1
Por que ajustar o tamanho da amostra?
46.7.2
Como ajustar para perda amostral?
46.8
Justificativa do tamanho da amostra
46.8.1
Como justificar o tamanho da amostra de um estudo?
46.8.2
Como justificar o tamanho da amostra em estudos qualitativos?
47
Seleção de testes
47.1
Multiverso de análises estatísticas
47.1.1
Por que escolher o teste é um problema?
47.2
Escolha de testes para análise inferencial
47.2.1
Como selecionar os testes para a análise estatística inferencial?
48
Plano de análise
48.1
Plano de análise estatística
48.1.1
O que é plano de análise estatística?
48.1.2
Qual é a relação entre pergunta científica e plano de análise?
48.1.3
Por que a pré-especificação do plano de análise é fundamental?
48.1.4
Como o plano de análise lida com dados perdidos?
48.2
Estimandos
48.2.1
O que são estimandos e por que eles são importantes?
48.2.2
Qual é a diferença entre estimando teórico e estimando empírico?
48.2.3
Por que definir o estimando antes do método estatístico?
48.2.4
Quais componentes devem ser definidos em um estimando?
48.2.5
Qual é a relação entre estimando, estimador e método estatístico?
48.2.6
Como a definição explícita do estimando melhora o Plano de Análise Estatística?
48.2.7
Por que o estimando deve existir fora do modelo estatístico?
48.3
Diretrizes para redação
48.3.1
Quais são as diretrizes para redação de planos de análise estatística?
PARTE 10: DELINEAMENTOS E SÍNTESE DE EVIDÊNCIAS
49
Delineamento de estudos
49.1
Critérios de delineamento
49.1.1
Quais critérios são utilizados para classificar os delineamentos de estudos?
49.2
Alocação
49.2.1
O que é alocação?
49.2.2
Quais são os tipos de alocação?
49.2.3
O que é alocação oculta (allocation concealment)?
49.2.4
A alocação oculta é obrigatória em ensaios clínicos?
49.3
Mascaramento
49.3.1
O que é mascaramento?
49.3.2
Por que o mascaramento é tão importante?
49.3.3
Quem pode ser mascarado?
49.3.4
Quais são os tipos de mascaramento?
49.3.5
Qual é a diferença entre alocação oculta e mascaramento?
49.4
Pareamento
49.4.1
O que é pareamento?
49.5
Aleatorização
49.5.1
O que é aleatorização?
49.5.2
Quais são os métodos de aleatorização?
49.5.3
Quais são as vantagens e desvantagens da aleatorização simples?
49.6
Taxonomia de estudos
49.6.1
Como podem ser classificados os estudos científicos?
49.7
Hierarquia da evidência científica
49.7.1
Quais são os modelos de hierarquia da evidência científica?
49.7.2
Quais são as limitações da hierarquia da evidência científica?
50
Simulação computacional
50.1
Simulações computacionais
50.1.1
O que são simulações computacionais?
50.1.2
Por que estudos de simulação devem ser tratados como experimentos científicos?
50.1.3
O que são estudos de simulação estatística?
50.1.4
Qual é o papel dos estudos de simulação em pesquisa científica?
50.1.5
Por que não avaliar métodos estatísticos apenas com dados reais?
50.1.6
Quais são as principais vantagens de estudos de simulação?
50.1.7
Quais são as limitações de estudos de simulação?
50.2
Métodos de simulação
50.2.1
Quais são os elementos fundamentais de um estudo de simulação?
50.2.2
O que é um cenário de simulação?
50.2.3
Quais são os principais elementos para avaliar a qualidade de um modelo de simulação?
50.2.4
Por que é necessário repetir muitas simulações?
50.2.5
Quais boas práticas devem ser seguidas em estudos de modelagem e simulação?
50.3
Método de Monte Carlo
50.3.1
O que é o método de Monte Carlo?
50.3.2
Como escolher a distribuição adequada em um estudo de simulação?
50.4
Avaliação de métodos estatísticos em simulações
50.4.1
Quais critérios são usados para avaliar métodos estatísticos em simulações?
50.4.2
O que é o erro padrão de Monte Carlo?
50.5
Diretrizes para redação
50.5.1
Quais são as diretrizes para redação de estudos de simulação computacional?
51
Pesquisa qualitativa
51.1
Pesquisa qualitativa
51.1.1
O que é pesquisa qualitativa?
51.2
Diretrizes para redação
51.2.1
Quais são as diretrizes para redação de estudos de propriedades psicométricas?
52
Estudos observacionais
52.1
Características
52.1.1
Quais são as características de estudos observacionais?
52.2
Diretrizes para redação
52.2.1
Quais são as diretrizes para redação de estudos observacionais?
53
Ciência cidadã
53.1
Introdução
53.1.1
O que é Ciência Cidadã?
53.1.2
Que tipo de dados ela produz?
53.1.3
Como ela difere de amostragem tradicional?
53.1.4
Quais erros são mais comuns?
53.1.5
Quando esses dados são válidos?
53.1.6
Quando não são?
53.1.7
Como documentar metadados?
53.1.8
Que análises fazem sentido?
53.1.9
Como relatar resultados com honestidade?
54
Estudos metodológicos
54.1
Concordância
54.1.1
O que é concordância?
54.1.2
Quais métodos são adequados para análise de concordância de variáveis dicotômicas?
54.1.3
Quais métodos não são adequados para análise de concordância de variáveis dicotômicas?
54.1.4
Quais métodos são adequados para análise de concordância de variáveis categóricas?
54.1.5
Quais métodos são adequados para análise de concordância de variáveis ordinais?
54.1.6
Quais métodos são adequados para análise de concordância de variáveis contínuas?
54.1.7
Quais métodos não são adequados para análise de concordância de variáveis contínuas?
54.1.8
Quais métodos são adequados para modelagem de concordância?
54.2
Confiabilidade
54.2.1
O que é confiabilidade?
54.2.2
Quais métodos são adequados para análise de confiabilidade?
54.3
Diretrizes para redação
54.3.1
Quais são as diretrizes para redação de estudos de propriedades psicométricas?
55
Estudos psicométricos
55.1
Características
55.1.1
O que são propriedades psicométricas?
55.2
Análise fatorial exploratória
55.2.1
O que é análise fatorial exploratória?
55.3
Análise fatorial confirmatória
55.3.1
O que é análise fatorial confirmatória?
55.4
Validade de conteúdo
55.4.1
O que é validade interna?
55.4.2
O que é validade externa?
55.4.3
Que fatores afetam a validade?
55.4.4
Como avaliar a validade de um estudo?
55.4.5
Qual é a importância da validade externa em ensaios quase-experimentais?
55.5
Validade de face
55.5.1
O que é validade de face?
55.6
Validade do construto
55.6.1
O que é construto?
55.7
Validade fatorial
55.7.1
O que é validade fatorial?
55.8
Validade convergente
55.8.1
O que é validade convergente?
55.9
Validade discriminante
55.9.1
O que é validade discriminante?
55.10
Validade de critério
55.10.1
O que é validade de critério?
55.11
Validade concorrente
55.11.1
O que é concorrente?
55.11.2
O que é validade concorrente?
55.11.3
O que é validade preditiva?
55.12
Responsividade
55.12.1
O que é responsividade?
55.13
Diretrizes para redação
55.13.1
Quais são as diretrizes para redação de estudos de propriedades psicométricas?
56
Desempenho diagnóstico
56.1
Tabelas 2x2
56.1.1
O que é uma tabela de confusão 2x2?
56.1.2
Como analisar o desempenho diagnóstico em tabelas 2x2?
56.1.3
Quais probabilidades caracterizam o desempenho diagnóstico de um teste em tabelas 2x2?
56.2
Tabelas 2x3
56.2.1
O que é uma tabela de confusão 2x3?
56.2.2
Como as regiões POS, BND e NEG são definidas?
56.2.3
Qual é o formato de uma tabela 2×3?
56.2.4
Quais são as medidas básicas na 2×3?
56.2.5
Como escolher os limiares
\(\alpha\)
e
\(\beta\)
?
56.2.6
Quando preferir 3-vias em vez de 2×2?
56.3
Curvas ROC
56.3.1
O que representa a curva ROC?
56.3.2
Quais são os tipos de curva ROC?
56.3.3
Como definir o melhor ponto de corte?
56.3.4
O que é a área sob a curva (AUROC)?
56.3.5
Como calcular a AUC?
56.3.6
Como interpretar a área sob a curva (ROC)?
56.3.7
Por que uma AUC menor que 0.5 está errada?
56.3.8
Como analisar o desempenho diagnóstico em desfechos com distribuição trimodal na população?
56.4
Interpretação da validade de um teste
56.4.1
Que itens devem ser verificados na interpretação de um estudo de validade?
56.5
Diretrizes para redação
56.5.1
Quais são as diretrizes para redação de estudos diagnósticos?
57
n-de-1
57.1
Ensaio n-de-1
57.1.1
O que são ensaios n-de-1?
57.1.2
Quando é apropriado conduzir ensaios n-de-1?
57.1.3
Qual a relevância dos ensaios n-de-1?
57.2
Aspectos metodológicos
57.2.1
Quais são os principais aspectos do delineamento de ensaios n-de-1?
57.2.2
Quantos períodos são usualmente utilizados?
57.2.3
Como é feita a randomização?
57.2.4
Quais perguntas de inferência podem ser respondidas?
57.3
Análise de dados
57.3.1
Como são feitas as análises?
57.3.2
Quais métodos estatísticos têm sido utilizados recentemente?
57.3.3
É adequado utilizar P-valores em ensaios n-de-1?
57.3.4
Como os dados de ensaios n-de-1 podem ser visualizados?
57.3.5
Quais métodos estatísticos são usados na análise?
57.4
Abordagem meta-analítica
57.4.1
Como um conjunto de ensaios n-de-1 pode ser analisado conjuntamente?
57.4.2
Por que a meta-análise com efeitos aleatórios produz intervalos de confiança mais amplos?
57.4.3
Qual é a principal vantagem da abordagem meta-analítica?
57.5
Limitações e cuidados
57.5.1
Quais são os principais desafios dos ensaios n-de-1?
58
Ensaios cruzados
58.1
Características
58.1.1
O que é um ensaio cruzado?
58.1.2
Qual é a principal característica metodológica de ensaios cruzados?
58.1.3
Quais são os principais componentes de um ensaio cruzado?
58.1.4
Quais são as principais vantagens dos ensaios cruzados?
58.1.5
Quais são as limitações dos ensaios cruzados?
58.2
Análise estatística
58.2.1
Quais são as considerações para análise estatística de ensaios cruzados?
58.2.2
Como os efeitos do tratamento são avaliados em ensaios cruzados?
58.2.3
Como verificar a presença de efeitos de
carryover
?
58.2.4
O que fazer quando há evidência de
carryover
?
58.2.5
Como lidar com dados perdidos em ensaios cruzados?
58.3
Extensões do delineamento
58.3.1
Existem variações do ensaio cruzado?
58.4
Diretrizes para redação
58.4.1
Quais são as diretrizes para redação de ensaios cruzados?
59
Ensaios quase-experimentais
59.1
Características
59.1.1
Quais são as características de ensaios quase-experimentais?
59.2
Séries temporais interrompidas
59.2.1
O que são séries temporais interrompidas?
59.2.2
Quando utilizar séries temporais interrompidas?
59.2.3
O que é o modelo contrafactual em séries temporais interrompidas?
59.2.4
O que representam mudanças de nível e inclinação em séries temporais interrompidas?
59.2.5
Por que especificar o modelo de impacto a priori?
59.3
Séries temporais interrompidas controladas
59.3.1
O que são séries temporais interrompidas controladas?
59.4
Interação e heterogeneidade de efeito
59.4.1
Como avaliar heterogeneidade de efeito em séries temporais interrompidas?
59.5
Pressupostos do delineamento
59.5.1
Quais são os principais pressupostos de séries temporais interrompidas?
59.6
Limitações dos modelos simples
59.6.1
Quais são as limitações de modelos ITS simples?
59.7
Vieses e ameaças à validade
59.7.1
Quais são as principais ameaças à validade em séries temporais interrompidas?
59.7.2
O que é autocorrelação em séries temporais interrompidas?
59.7.3
Como controlar sazonalidade em séries temporais interrompidas?
59.8
Diretrizes para redação
59.8.1
Quais são as diretrizes para redação de ensaios quase-experimentais?
60
Ensaios experimentais
60.1
Ensaio experimental aleatorizado
60.1.1
Quais são as características de ensaios experimentais aleatorizados?
60.1.2
Quais são as estratégias metodológicas para reduzir vieses?
60.2
Modelos de análise de comparação
60.2.1
Que modelos podem ser utilizados para comparações?
60.3
Comparação na linha de base
60.3.1
O que são dados na linha de base?
60.3.2
O que é comparação entre grupos na linha de base em ensaios experimentais aleatorizados?
60.3.3
Quais são as razões para diferenças entre grupos de tratamento nas (co)variáveis na linha de base?
60.3.4
Para quê comparar grupos na linha de base em ensaios experimentais aleatorizados?
60.3.5
Quais cenários permitem a comparação entre grupos na linha de base em ensaios experimentais aleatorizados?
60.3.6
Por que não se deve comparar grupos na linha de base em ensaios experimentais aleatorizados?
60.3.7
Quais estratégias podem ser adotadas para substituir a comparação entre grupos na linha de base em ensaios experimentais aleatorizados?
60.4
Comparação intragrupos
60.4.1
Por que não se deve comparar intragrupos (pré - pós) em ensaios experimentais aleatorizados?
60.5
Comparação entre grupos
60.5.1
O que é comparação entre grupos em ensaios experimentais aleatorizados?
60.5.2
O que pode ser comparado entre grupos?
60.5.3
Qual é a comparação entre grupos mais adequada em ensaios experimentais aleatorizados?
60.6
Comparação de subgrupos
60.6.1
O que é comparação de subgrupos em ensaios experimentais aleatorizados?
60.6.2
Como realizar a comparação de subgrupos em ensaios experimentais aleatorizados?
60.6.3
Como interpretar a comparação de subgrupos em ensaios experimentais aleatorizados?
60.7
Efeito de interação
60.7.1
Por que analisar o efeito de interação?
60.7.2
Quando usar o termo de interação?
60.8
Ajuste de covariáveis
60.8.1
Quais variáveis devem ser utilizadas no ajuste de covariáveis?
60.8.2
Quais os benefícios do ajuste de covariáveis?
60.8.3
Quais os riscos do ajuste de covariáveis?
60.9
Imputação de dados perdidos
60.9.1
Como lidar com os dados perdidos em desfechos?
60.9.2
Como lidar com os dados perdidos em covariáveis?
60.10
Diretrizes para redação
60.10.1
Quais são as diretrizes para redação de ensaios experimentais?
61
Revisão sistemática
61.1
Tipologia de revisões
61.1.1
O que é a tipologia de revisões?
61.2
Revisão sistemática de literatura
61.2.1
O que é revisão sistemática?
61.3
Tipos de revisão sistemática
61.3.1
Quais são os principais tipos de revisão sistemática?
61.3.2
Quais delineamentos de revisão parecem mas não são revisões sistemáticas?
61.4
Diretrizes para redação
61.4.1
Quais são as diretrizes para revisão sistemática?
62
Meta-análise
62.1
Características
62.1.1
O que é meta-análise?
62.2
Modelos de meta-análise
62.2.1
Quais são os principais modelos de meta-análise?
62.3
Conversão de Medidas em Meta-análises
62.3.1
O que fazer quando os estudos apresentam resultados com diferentes parâmetros?
62.4
Interpretação de efeitos em meta-análise
62.4.1
Como avaliar a variação do tamanho do efeito?
62.4.2
Como avaliar a heterogeneidade entre os estudos?
62.5
Forest plot
62.5.1
O que é um
forest plot
?
62.5.2
Quais são as seis colunas básicas que um
forest plot
geralmente apresenta?
62.5.3
Como diferenciar um desfecho binário de um contínuo em um
forest plot
?
62.5.4
O que representa o ponto central da caixa e o tamanho desta no gráfico?
62.5.5
Qual é o significado da linha vertical do “nenhum efeito”?
62.5.6
Como interpretar o diamante na parte inferior do
forest plot
?
62.5.7
Como a heterogeneidade pode ser avaliada no
forest plot
?
62.5.8
Quais são as interpretações usuais para os valores de heterogeneidade?
62.6
Crosshair
62.6.1
O que um gráfico de cruzes (
crosshair
)?
62.7
Funnel plot
62.7.1
O que é um gráfico de funil (
funnel plot
)?
62.7.2
O que é viés de publicação?
62.7.3
Quais métodos podem ser usados para identificar viés de publicação?
62.7.4
A assimetria do
funnel plot
indica sempre viés de publicação?
62.7.5
O que é
trim and fill
?
62.8
Testes de assimetria do
funnel plot
62.8.1
O que é o teste de Egger?
62.8.2
O que é o teste de Peters?
62.8.3
Quais são as recomendações para testar a assimetria?
62.8.4
Como interpretar os resultados de testes de viés de publicação?
62.9
Diretrizes para redação
62.9.1
Quais são as diretrizes para redação de meta-análises?
63
Revisão guarda-chuva
63.1
Revisão guarda-chuva
63.1.1
O que é revisão guarda-chuva?
63.2
Diretrizes para redação
63.2.1
Quais são as diretrizes para revisão sistemática?
64
Análise de custo-efetividade
64.1
Análise de Custo-efetividade
64.1.1
O que é análise de custo-efetividade?
PARTE 11: COMUNICAÇÃO E RELATO CIENTÍFICO
65
Redação de resultados
65.1
Comunicação de resultados da análise estatística
65.1.1
Qual é o objetivo final da seção de resultados estatísticos?
65.1.2
Como garantir consistência entre métodos e resultados?
65.1.3
Como devo comunicar probabilidades e riscos?
65.1.4
Qual é o formato numérico mais adequado para apresentar riscos?
65.1.5
Como devo apresentar diferenças entre grupos ou intervenções?
65.1.6
Como evitar distorções na interpretação de benefícios e riscos?
65.1.7
Como devo usar gráficos para apresentar probabilidades e efeitos?
65.1.8
O que fazer ao apresentar valores pouco familiares ao leitor?
65.1.9
Posso usar linguagem causal ao descrever resultados?
65.2
Diretrizes e Listas
65.2.1
Quais diretrizes estão disponíveis para redação estatística?
65.2.2
Quais listas de verificação estão disponíveis para redação estatística?
66
Tabelas
66.1
Tabelas
66.1.1
Por que usar tabelas?
66.1.2
Que informações incluir nas tabelas?
66.1.3
Quais são os tipos de tabelas?
66.1.4
Quais são os erros mais comuns de preenchimento de tabelas?
66.2
Tabela 1
66.2.1
O que é a ‘Tabela 1’?
66.2.2
Qual a utilidade da ‘Tabela 1’?
66.2.3
O que é a falácia da ‘Tabela 1’?
66.2.4
Como construir a ‘Tabela 1’?
66.3
Tabela 2
66.3.1
Qual a utilidade da ‘Tabela 2’?
66.3.2
O que é a falácia da ‘Tabela 2’?
66.3.3
Como construir a ‘Tabela 2’?
67
Gráficos
67.1
Análise descritiva
67.2
Visualização efetiva de dados
67.2.1
Por que começar pela mensagem antes do gráfico?
67.2.2
Como escolher a geometria e “mostrar os dados”?
67.3
Gráficos
67.3.1
O que são gráficos?
67.3.2
O que torna um bom gráfico tão poderoso?
67.3.3
Que elementos incluir em gráficos?
67.3.4
Para que servem as barras de erro em gráficos?
67.3.5
Quais são os principais obstáculos para bons gráficos?
67.4
Tipos de gráficos
67.4.1
Quais são os tipos de gráficos para variáveis categóricas?
67.4.2
Quais são os tipos de gráficos para variáveis numéricas?
67.4.3
Quais são os tipos de gráficos para relações entre variáveis?
67.4.4
Quais são os tipos de gráficos para dados longitudinais?
67.4.5
Quais são os tipos de gráficos para séries temporais?
67.4.6
Quais são os tipos de gráficos para avaliação de resposta longitudinal?
67.4.7
Quais são os tipos de gráficos para dados multivariados?
67.4.8
Quais são as melhores práticas na elaboração de gráficos?
67.5
Fluxogramas
67.5.1
O que é um fluxogramas?
68
Diretrizes e Listas
68.1
Diretrizes
68.1.1
Quais são as diretrizes para relatórios estatísticos em pesquisas?
68.2
Listas de verificação
68.2.1
Quais são as listas de verificação para relatórios estatísticos em pesquisas?
PRODUÇÃO DO AUTOR
Produção do autor
Artigos em periódicos científicos
Preprints
Resumos publicados em eventos científicos
Livros
Livros editorados
Capítulos de livro
Programas de computador
Bancos de dados
Aulas
Palestras
Outros
REFERÊNCIAS
Fontes externas
Fontes de informação externas
American Heart Association
American Physiological Society
American Statistical Association
British Medicine Journal
Enhancing the QUality And Transparency Of health Research Network
Journal of the Amercan Medical Association
Nature Publishing Group
Oxford Reference
Royal Statistical Society
Statistics in Medicine
BMC Trials
The Journal of Applied Statistics in the Pharmaceutical Industry
Referências
Publicado com Bookdown
Ciência com R
PARTE 2: AMEAÇAS À QUALIDADE DA EVIDÊNCIA CIENTÍFICA
Vieses Metodológicos, Erros de Interpretação e Condutas Questionáveis