e-Book | Consultoria
Capa
Dedicatória
Agradecimentos
Apresentação
Sobre o autor
PARTE 1: PENSAMENTO CIENTÍFICO
1
Pensamento computacional
1.1
R
1.1.1
O que é R?
1.1.2
Por que usar R?
1.1.3
O que é R Markdown?
1.1.4
Que programas de computador podem ser usados para análise estatística com R?
1.2
RStudio
1.2.1
O que é RStudio?
1.3
Scripts
1.3.1
O que são R scripts?
1.3.2
Quais são as melhores práticas na redação de
scripts
?
1.3.3
O que é controle de versão?
1.4
Pacotes
1.4.1
O que são pacotes?
1.5
Manuscritos reproduzíveis
1.5.1
O que são manuscritos reproduzíveis?
1.5.2
Por que usar manuscritos reproduzíveis?
1.5.3
Como manuscritos reproduzíveis contribuem para a ciência?
1.6
Websites reproduzíveis para projetos científicos
1.6.1
O que são websites reproduzíveis para projetos científicos?
1.7
Aplicativos Shiny
1.7.1
O que são Shiny Apps?
1.7.2
Quais são as boas práticas para desenvolver Shiny apps?
1.8
Compartilhamento
1.8.1
Por que compartilhar scripts?
1.8.2
O que pode ser compartilhado?
1.8.3
Como preparar scripts para compartilhamento?
1.8.4
O que incluir no arquivo README?
1.9
Fluxos de trabalho
1.9.1
O que são fluxos de trabalho reproduzíveis?
2
Pensamento metodológico
2.1
Metodologia da pesquisa
2.1.1
O que é metodologia da pesquisa?
2.2
Pesquisa quantitativa vs. qualitativa
2.2.1
O que diferencia pesquisa qualitativa da quantitativa?
2.2.2
Por que essa dicotomia pode ser problemática?
2.3
Pesquisa de métodos mistos
2.3.1
O que é pesquisa de métodos mistos?
2.3.2
Métodos mistos significam misturar paradigmas epistemológicos?
2.3.3
Quais são as principais dimensões do desenho de métodos mistos?
2.3.4
Quais são os delineamentos centrais em pesquisa de métodos mistos?
2.4
Pesquisa multi-métodos
2.4.1
O que é pesquisa multi-métodos?
2.4.2
Qual é o principal objetivo da pesquisa multi-métodos?
2.4.3
Qual a diferença essencial entre métodos mistos e multi-métodos?
2.4.4
Quando utilizar pesquisa multi-métodos?
2.4.5
Quais são as limitações da pesquisa multi-métodos?
2.5
Pesquisa exploratória vs. confirmatória
2.5.1
O que são pesquisas exploratórias e confirmatórias?
2.5.2
Por que a dicotomia é limitada?
2.5.3
Quais são as melhores práticas de transparência?
2.6
Pré-registro
2.6.1
O que é pré-registro?
2.7
Reprodutibilidade e Ciência Aberta
2.7.1
O que é reprodutibilidade?
2.7.2
Por que reprodutibilidade é importante?
2.7.3
Como contribuir para a reprodutibilidade?
2.8
Robustez
2.8.1
O que é robustez?
2.9
Replicabilidade
2.9.1
O que é replicabilidade?
2.10
Generalização
2.10.1
O que é generalização?
2.10.2
O que é generalização estatística?
2.10.3
O que é generalização analítica?
2.10.4
Quais são os mitos mais comuns sobre generalização?
2.10.5
Generalizações são conclusões definitivas?
2.10.6
Como a replicação contribui para a generalização?
2.10.7
Como revisões sistemáticas e meta-análises ampliam a generalização?
3
Pensamento causal
3.1
Causalidade
3.1.1
O que causalidade?
3.1.2
Quais os dois grandes tipos de causalidade?
3.2
Abordagens filosóficas e estatísticas da causalidade
3.2.1
O que é realidade causal?
3.2.2
Por que estatísticos historicamente evitaram falar em causalidade?
3.3
Ilusões de causalidade
3.3.1
O que são ilusões de causalidade?
3.3.2
Quais fatores favorecem a ilusão?
3.3.3
Como reduzir ilusões de causalidade?
3.4
O papel do tempo e a causalidade dinâmica
3.4.1
O que é causalidade de Granger?
3.4.2
Por que o tempo é essencial na análise causal?
4
Pensamento probabilístico
4.1
Experimento
4.1.1
O que é um experimento?
4.1.2
O que é um experimento aleatório?
4.2
Espaço amostral e eventos discretos
4.2.1
O que é espaço amostral discreto?
4.2.2
O que é evento discreto?
4.2.3
O que é espaço de eventos discretos?
4.3
Espaço amostral e eventos contínuos
4.3.1
O que é espaço amostral contínuo?
4.3.2
O que é evento contínuo?
4.3.3
O que é espaço de eventos contínuo?
4.4
Probabilidade
4.4.1
O que é probabilidade?
4.4.2
Quais são os axiomas da probabilidade?
4.4.3
Quais as consequências dos axiomas da probabilidade?
4.5
Independência e probabilidade
4.5.1
O que é independência em estatística?
4.5.2
O que é probabilidade marginal?
4.5.3
O que é probabilidade conjunta?
4.5.4
O que é probabilidade condicional?
4.6
Leis dos números anômalos
4.6.1
O que é a lei dos números anômalos?
4.7
Leis dos pequenos números
4.7.1
O que é a lei dos pequenos números?
4.7.2
Quais são as versões da lei dos pequenos números?
4.8
Leis dos grandes números
4.8.1
O que é a lei dos grandes números?
4.8.2
Quais são as versões da lei dos grandes números?
4.9
Teorema central do limite
4.9.1
O que é teorema central do limite?
4.9.2
Quais as condições de validade do teorema central do limite?
4.9.3
Qual a relação entre a lei dos grandes números e o teorema central do limite?
4.9.4
Qual a relevância do teorema central do limite para a análise estatística?
4.10
Regressão para a média
4.10.1
O que é regressão para a média?
4.10.2
Qual a causa da regressão para a média?
4.10.3
Por que detectar o fenômeno de regressão para a média?
4.10.4
Como detectar o fenômeno de regressão para a média?
4.10.5
Como o fenômeno de regressão para a média pode ser evitado?
5
Pensamento estatístico
5.1
População
5.1.1
O que é população?
5.1.2
O que é representatividade e por que ela importa?
5.2
Amostra
5.2.1
O que é amostra?
5.2.2
Por que usar dados de amostras?
5.3
Unidade de análise
5.3.1
O que é unidade de análise?
5.3.2
Por que identificar a unidade de análise de um estudo?
5.4
Amostragem
5.4.1
O que é amostragem?
5.4.2
Quais métodos de amostragem da população são usados?
5.4.3
O que é erro de amostragem?
5.5
Reamostragem
5.5.1
O que é reamostragem?
5.5.2
Por que utilizar reamostragem?
5.5.3
Quais métodos de reamostragem podem ser realizados?
5.6
Subamostragem
5.6.1
O que é subamostragem?
5.7
Superamostragem
5.7.1
O que é superamostragem?
6
Letramento estatístico
6.1
Introdução ao letramento estatístico
6.1.1
O que é letramento estatístico?
6.1.2
Por que o letramento estatístico é importante?
6.1.3
Quais são exemplos de armadilhas comuns na interpretação de estatísticas?
6.2
Elementos centrais do letramento estatístico
6.2.1
Quais elementos sustentam o letramento estatístico?
6.2.2
Quais são os elementos que facilitam a ação estatisticamente letrada?
6.2.3
Quais são os componentes do letramento estatístico?
6.2.4
Quais são os níveis de letramento estatístico?
6.3
Habilidades de letramento estatístico baseadas no pensamento crítico
6.3.1
Quais são as perguntas críticas na interpretação estatística?
6.3.2
Quais são as habilidades de letramento estatístico?
PARTE 2: AMEAÇAS À QUALIDADE DA EVIDÊNCIA CIENTÍFICA
7
Vieses
7.1
Vieses metodológicos
7.1.1
O que são vieses metodológicos?
7.2
Tipos de vieses metodológicos
7.2.1
Quais são os tipos de vieses metodológicos?
7.3
Diretrizes para redação
7.3.1
Quais são as diretrizes para redação de análises de vieses metodológicos?
8
Falácias estatísticas
8.1
Falácias estatísticas
8.1.1
O que são falácias estatísticas?
8.1.2
O que é a falácia do jogador?
8.1.3
O que é a falácia da mão quente?
8.1.4
O que é a falácia correlação
\(neq\)
causalidade?
8.1.5
O que é a falácia dos dados agregados?
8.1.6
O que é a falácia da comparação injusta?
8.1.7
O que é a falácia do
cherry-picking
?
8.1.8
O que é a falácia da significância estatística?
8.1.9
O que é a falácia dos múltiplos testes?
9
Paradoxos estatísticos
9.1
Paradoxos
9.1.1
O que são paradoxos estatísticos?
9.1.2
O que é o paradoxo de Abelson?
9.1.3
O que é o paradoxo de Berkson?
9.1.4
O que é o paradoxo de Ellsberg?
9.1.5
O que é o paradoxo de Freedman?
9.1.6
O que é o paradoxo de Hand?
9.1.7
O que é o paradoxo de Kelley?
9.1.8
O que é o paradoxo de Lindley?
9.1.9
O que é o paradoxo de Lord?
9.1.10
O que é o paradoxo de Meng?
9.1.11
O que é o paradoxo de Proebsting?
9.1.12
O que é o paradoxo de Simpson?
9.1.13
O que é o paradoxo de James-Stein?
9.1.14
O que é o paradoxo de Okie?
9.1.15
O que é o paradoxo da acurácia?
9.1.16
O que é o paradoxo do falso positivo?
9.1.17
O que é o paradoxo da caixa de Bertrand?
9.1.18
O que é o paradoxo do elevador?
9.1.19
O que é o paradoxo da amizade?
9.1.20
O que é o paradoxo do menino ou menina?
9.1.21
O que é o paradoxo do aniversário?
9.1.22
O que é o paradoxo do teste surpresa?
9.1.23
O que é o paradoxo do nó da gravata?
9.1.24
O que é o paradoxo de Monty Hall?
9.1.25
O que é o paradoxo da Bela Adormecida?
10
Práticas questionáveis em pesquisa
10.1
Práticas Questionáveis
10.1.1
O que são práticas questionáveis em pesquisa?
10.1.2
Por que práticas questionáveis em pesquisa devem ser combatidas?
10.2
Prática não intencional e má conduta
10.2.1
Quais são as categorias de práticas questionáveis em pesquisa?
10.2.2
Práticas questionáveis no planejamento do estudo?
10.2.3
Práticas questionáveis na coleta de dados?
10.2.4
Práticas questionáveis na análise dos dados?
10.2.5
Práticas questionáveis na apresentação dos resultados?
10.2.6
Práticas questionáveis na revisão por pares?
10.2.7
Práticas questionáveis na publicação?
10.3
Prevenindo práticas questionáveis em pesquisa
10.3.1
Como prevenir práticas questionáveis?
10.4
Reações éticas e institucionais práticas questionáveis em pesquisa
10.4.1
Quais são as reações a práticas questionáveis em pesquisa?
PARTE 3: DO MUNDO REAL À TABELA
11
Variáveis e fatores
11.1
Variáveis
11.1.1
O que são variáveis?
11.1.2
Como são classificadas as variáveis?
11.2
Transformação de variáveis
11.2.1
Por que é importante classificar as variáveis?
11.2.2
O que é transformação de variáveis?
11.2.3
Por que transformar variáveis?
11.2.4
Quais transformações de variáveis podem ser aplicadas?
11.3
Centralização de variáveis
11.3.1
O que é centralização de variáveis?
11.3.2
Por que centralizar variáveis?
11.4
Padronização de variáveis
11.4.1
O que é padronização de variáveis?
11.4.2
Por que padronizar variáveis?
11.4.3
Quais são os métodos de padronização mais comuns?
11.4.4
Quais são as melhores práticas de nomenclatura ao padronizar variáveis?
11.5
Categorização de variáveis contínuas
11.5.1
Por que não é recomendado categorizar variáveis contínuas?
11.5.2
Quais são as alternativas à categorização de variáveis contínuas?
11.6
Dicotomização de variáveis contínuas
11.6.1
O que são variáveis dicotômicas?
11.6.2
Quais argumentos defendem a dicotomização de variáveis contínuas?
11.6.3
Por que a dicotomização não é recomendada?
11.6.4
Quais cenários legitimam a dicotomização das variáveis contínuas?
11.6.5
Quais métodos são usados para dicotomizar variáveis contínuas?
11.7
Representação de variáveis categóricas
11.7.1
O que são variáveis indicadoras (
dummy variables
)?
11.7.2
Por que variáveis indicadoras são importantes?
11.7.3
Quantas variáveis indicadoras são necessárias para um fator?
11.7.4
O que é o nível de referência?
11.7.5
Por que não se usam
\(k\)
variáveis indicadoras para
\(k\)
níveis?
11.7.6
Variáveis indicadoras são uma forma de dicotomização?
11.7.7
Variáveis indicadoras alteram os dados originais?
11.8
Fatores
11.8.1
O que são fatores?
11.8.2
O que são níveis de um fator?
12
Dados e metadados
12.1
Dados
12.1.1
O que são dados?
12.1.2
O que são dados estruturados?
12.1.3
O que são dados não estruturados?
12.2
Big data
12.2.1
O que são grandes dados (
big data
)?
12.2.2
O que são dados primários e secundários?
12.3
Metadados
12.3.1
O que são metadados?
12.3.2
Quais são as recomendações para os metadados de um banco de dados?
12.4
Armazenamento de dados
12.4.1
Como armazenar dados?
13
Medidas e instrumentos
13.1
Escalas
13.1.1
O que são escalas?
13.1.2
O que são escalas tipo Likert?
13.2
Medição e Medidas
13.2.1
O que é medição?
13.2.2
O que são medidas diretas?
13.2.3
O que são medidas derivadas?
13.2.4
O que são medidas por teoria?
13.2.5
O que são medidas únicas?
13.2.6
O que são medidas repetidas?
13.2.7
O que são medidas seriadas?
13.2.8
O que são medidas múltiplas?
13.3
Erro de medida
13.3.1
O que são erros de medida?
13.3.2
Quais fontes de variabilidade são comumente investigadas?
13.4
Instrumentos
13.4.1
O que são instrumentos?
13.5
Acurácia e precisão
13.5.1
O que é acurácia?
13.5.2
O que é precisão?
13.6
Viés e variabilidade
13.6.1
Qual é a relação entre viés e variabilidade?
14
Tabulação de dados
14.1
Planilhas eletrônicas
14.1.1
Qual a organização de uma tabela de dados?
14.1.2
Qual a estrutura básica de uma tabela para análise estatística?
14.1.3
O que usar para organizar tabelas para análise computadorizada?
14.1.4
O que não usar para organizar tabelas para análise computadorizada?
14.1.5
O que é recomendado e o que deve ser evitado na organização das tabelas para análise?
15
Vinculação e pareamento de dados
15.1
Vinculação e pareamento de dados
15.1.1
O que é vinculação e pareamento de dados?
15.2
Abordagens de vinculação
15.2.1
Quais são as abordagens de vinculação?
15.3
Erros de vinculação
15.3.1
Quais são os erros comuns na vinculação de dados?
15.4
Controle de qualidade
15.4.1
Como controlar a qualidade da vinculação de dados?
16
Dados perdidos e imputados
16.1
Dados perdidos
16.1.1
O que são dados perdidos?
16.1.2
Qual o problema de um estudo ter dados perdidos?
16.2
Mecanismos geradores de dados perdidos
16.2.1
Quais são os mecanismos geradores de dados perdidos?
16.2.2
Como identificar o mecanismo gerador de dados perdidos em um banco de dados?
16.3
Estratégias para lidar com dados perdidos
16.3.1
Que estratégias utilizar na coleta quando há expectativa de perda?
16.3.2
Que estratégias utilizar na análise quando há dados perdidos?
16.3.3
O que reportar em estudos com dados perdidos?
16.4
Dados imputados
16.4.1
Quando a imputação de dados é indicada?
16.4.2
Quais são os métodos de imputação de dados?
17
Distribuições e parâmetros
17.1
Fontes de variabilidade
17.1.1
O que são fontes de variabilidade?
17.1.2
Quais são as principais fontes de variabilidade?
17.1.3
Por que identificar as fontes de variabilidade é importante?
17.2
Distribuições de probabilidade
17.2.1
O que são distribuições de probabilidade?
17.2.2
Como representar distribuições de probabilidade?
17.2.3
Quais características definem uma distribuição?
17.3
Tipos de distribuições
17.3.1
O que são distribuições empíricas?
17.3.2
O que são distribuições teóricas?
17.3.3
O que são distribuições amostrais?
17.3.4
Por que todas as distribuições são condicionais?
17.4
Distribuições univariadas
17.4.1
Quais são as distribuições mais comuns?
17.4.2
Quais são as funções de uma distribuição?
17.4.3
O que é a distribuição normal?
17.4.4
Que métodos podem ser utilizados para identificar a normalidade da distribuição?
17.5
Distribuições bivariadas
17.5.1
O que são distribuições bivariadas?
17.6
Distribuições multivariadas
17.6.1
O que são distribuições multivariadas?
17.7
Parâmetros
17.7.1
O que são parâmetros?
17.7.2
Que parâmetros podem ser estimados?
17.8
Tendência central
17.8.1
Que parâmetros de tendência central podem ser estimados?
17.8.2
Como escolher o parâmetro de tendência central?
17.9
Dispersão
17.9.1
Que parâmetros de dispersão podem ser estimados?
17.9.2
Como escolher o parâmetro de dispersão?
17.9.3
O que é a correção de Bessel para variância?
17.9.4
Por que a correção de Bessel para variância é importante?
17.10
Proporção
17.10.1
Que parâmetros de proporção podem ser estimados?
17.11
Extremos
17.11.1
Que parâmetros extremos podem ser estimados?
17.12
Erro
17.12.1
Que parâmetros de erro podem ser estimados?
17.13
Distribuição
17.13.1
Que parâmetros de distribuição podem ser estimados?
17.14
Parâmetros robustos
17.14.1
O que são parâmetros robustos?
17.14.2
Por que utilizar parâmetros robustos?
17.14.3
O que é ponto de quebra?
17.14.4
Que parâmetros robustos podem ser estimados?
18
Dados anonimizados e sintéticos
18.1
Dados anonimizados
18.1.1
O que são dados anonimizados?
18.1.2
Por que anonimização perfeita não existe?
18.1.3
Quais são os principais tipos de ataques contra dados anonimizados?
18.1.4
Como anonimizar os dados de um banco?
18.1.5
Quais são as limitações das técnicas de anonimização?
18.1.6
Qual é o equilíbrio entre privacidade e utilidade?
18.2
Dados sintéticos
18.2.1
O que são dados sintéticos?
18.2.2
Como dados sintéticos podem ser usados em
digital twins
?
PARTE 4: VISUALIZAÇÃO E COMUNICAÇÃO DE DADOS
19
Tabelas
19.1
Tabelas
19.1.1
Por que usar tabelas?
19.1.2
Que informações incluir nas tabelas?
19.1.3
Quais são os tipos de tabelas?
19.1.4
Quais são os erros mais comuns de preenchimento de tabelas?
19.2
Tabela 1
19.2.1
O que é a ‘Tabela 1’?
19.2.2
Qual a utilidade da ‘Tabela 1’?
19.2.3
Como construir a ‘Tabela 1’?
19.2.4
O que é a falácia da ‘Tabela 1’?
19.3
Tabela 2
19.3.1
Qual a utilidade da ‘Tabela 2’?
19.3.2
Como construir a ‘Tabela 2’?
19.3.3
O que é a falácia da ‘Tabela 2’?
20
Gráficos
20.1
Visualização efetiva de dados
20.1.1
Por que começar pela mensagem antes do gráfico?
20.1.2
Como escolher a geometria e “mostrar os dados”?
20.2
Gráficos
20.2.1
O que são gráficos?
20.2.2
O que torna um bom gráfico tão poderoso?
20.2.3
Que elementos incluir em gráficos?
20.2.4
Para que servem as barras de erro em gráficos?
20.2.5
Quais são os principais obstáculos para bons gráficos?
20.3
Tipos de gráficos
20.3.1
Quais são os tipos de gráficos para variáveis categóricas?
20.3.2
Quais são os tipos de gráficos para variáveis numéricas?
20.3.3
Quais são os tipos de gráficos para relações entre variáveis?
20.3.4
Quais são os tipos de gráficos para dados longitudinais?
20.3.5
Quais são os tipos de gráficos para séries temporais?
20.3.6
Quais são os tipos de gráficos para avaliação de resposta longitudinal?
20.3.7
Quais são os tipos de gráficos para dados multivariados?
20.3.8
Quais são as melhores práticas na elaboração de gráficos?
20.4
Fluxogramas
20.4.1
O que é um fluxograma?
20.4.2
Por que utilizar fluxogramas em artigos científicos?
20.4.3
Quando utilizar fluxogramas?
20.4.4
Quais são os elementos de um fluxograma?
20.4.5
Quais são os princípios de um fluxograma?
20.4.6
Como construir fluxogramas claros e eficientes?
21
Redação de resultados
21.1
Comunicação de resultados da análise estatística
21.1.1
Qual é o objetivo final da seção de resultados estatísticos?
21.1.2
Como garantir consistência entre métodos e resultados?
21.1.3
Como devo comunicar probabilidades e riscos?
21.1.4
Qual é o formato numérico mais adequado para apresentar riscos?
21.1.5
Como devo apresentar diferenças entre grupos ou intervenções?
21.1.6
Como evitar distorções na interpretação de benefícios e riscos?
21.1.7
Como devo usar gráficos para apresentar probabilidades e efeitos?
21.1.8
O que fazer ao apresentar valores pouco familiares ao leitor?
21.1.9
Posso usar linguagem causal ao descrever resultados?
21.2
Diretrizes e Listas
21.2.1
Quais diretrizes estão disponíveis para redação estatística?
21.2.2
Quais listas de verificação estão disponíveis para redação estatística?
22
Diretrizes e Listas
22.1
Diretrizes
22.1.1
Quais são as diretrizes para relatórios estatísticos em pesquisas?
22.2
Listas de verificação
22.2.1
Quais são as listas de verificação para relatórios estatísticos em pesquisas?
PARTE 5: ANÁLISES DESCRITIVAS E EXPLORATÓRIAS
23
Análise inicial de dados
23.1
Análise inicial de dados
23.1.1
O que é análise inicial de dados?
23.1.2
Como conduzir uma análise inicial de dados?
24
Análise descritiva
24.1
Análise descritiva
24.1.1
O que é análise descritiva?
24.1.2
Como apresentar os resultados descritivos?
24.2
Apresentação de resultados numéricos
24.2.1
O que são casas decimais?
24.2.2
O que são dígitos significativos?
24.2.3
Como arredondar dados numéricos?
25
Análise exploratória de dados
25.1
Análise exploratória de dados
25.1.1
O que é análise exploratória de dados?
25.1.2
Quais são os objetivos centrais da análise exploratória de dados?
25.1.3
Por que conduzir a análise exploratória de dados?
25.2
Quarteto de Anscombe
25.2.1
O que é o Quarteto de Anscombe?
25.3
Ingredientes da análise exploratória de dados
25.3.1
Quais são os principais elementos que compõem a análise exploratória de dados?
25.3.2
Quais etapas constituem a análise exploratória de dados?
26
Análise robusta
26.1
Raciocínio inferencial robusto
26.1.1
O que é análise robusta?
26.1.2
Por que usar análise robusta?
26.1.3
Quando usar análise robusta?
26.1.4
Por que métodos robustos são preferíveis?
26.2
Valores discrepantes
26.2.1
O que são valores discrepantes (
outliers
)?
26.2.2
Quais são os tipos de valores discrepantes?
26.2.3
Por que é importante avaliar valores discrepantes?
26.2.4
Como detectar valores discrepantes?
26.2.5
Quais são os métodos para detectar valores discrepantes?
26.2.6
Quais testes são apropriados para detectar valores discrepantes?
26.2.7
Como manejar os valores discrepantes?
26.2.8
Como conduzir análises com valores discrepantes?
26.2.9
Como lidar com
outliers
na análise exploratória de dados?
26.3
Valores influentes
26.3.1
O que são valores influentes?
26.3.2
O que é função de influência?
26.3.3
O que é ponto de quebra?
26.3.4
Como detectar valores influentes?
26.4
Métodos robustos de tratamento de
outliers
26.4.1
O que é Winsorização?
26.4.2
Quais são as alternativas à Winsorização?
27
Análise preditiva
27.1
Predição
27.1.1
O que são modelos preditivos clínicos?
27.1.2
Qual é a diferença entre predição diagnóstica e prognóstica?
27.1.3
Como avaliar o desempenho de um modelo preditivo?
27.1.4
O que é validação de um modelo preditivo?
27.1.5
Um modelo pode ser considerado definitivamente validado?
27.1.6
Por que a transportabilidade é um problema?
27.1.7
Quais são os principais riscos metodológicos em modelos preditivos?
27.1.8
Como melhorar o uso de modelos preditivos?
27.1.9
Como árvores de decisão são usadas para predição?
27.2
Interpretação e aplicação
27.2.1
Quais são as implicações do uso de árvores de decisão em predição?
27.2.2
Por que o desempenho estatístico não basta?
27.3
Análise de curva de decisão
27.3.1
O que é a análise de curva de decisão?
27.3.2
O que significam os eixos da curva de decisão?
27.3.3
Como interpretar o benefício líquido?
27.3.4
Por que é importante comparar sempre com “tratar todos” e “tratar nenhum”?
27.3.5
Quais são os limites e usos da análise de curva de decisão?
27.3.6
A análise de curva de decisão pode ser conduzida sem dados individuais de pacientes?
27.3.7
Como funciona o cálculo do benefício líquido?
28
Análise causal
28.1
Análise causal
28.1.1
O que é análise causal?
28.2
Inferência causal em estudos observacionais
28.2.1
Como diferenciar associação de causalidade?
28.2.2
Quais critérios ajudam a sustentar inferência causal?
28.2.3
Como lidar com confundimento residual?
28.3
Critérios de Hill para inferência causal
28.3.1
Quais são os nove critérios?
28.3.2
Hill propôs um checklist rígido?
28.4
Críticas contemporâneas aos critérios de Hill
28.4.1
Qual critério é indispensável?
28.4.2
A força da associação garante causalidade?
28.4.3
A consistência é indispensável?
28.4.4
O critério da especificidade é válido?
28.4.5
O gradiente biológico (dose–resposta) é confiável?
28.4.6
A plausibilidade e a coerência são objetivas?
28.4.7
Evidência experimental é decisiva?
28.4.8
Analogia é útil?
28.5
Visão atual sobre os critérios de Hill
28.5.1
Como os critérios de Hill foram revisitados?
28.5.2
Quais mudanças na interpretação?
28.6
Efeitos diretos e indiretos
28.6.1
Como distinguir efeitos diretos de indiretos?
28.7
Diagrama acíclico direcionado (DAG)
28.7.1
O que são diagramas acíclicos direcionados?
28.7.2
Quais são os padrões causais básicos?
28.7.3
Qual o papel dos caminhos causais?
28.8
Linguagem causal em estudos observacionais
28.8.1
Quais são as principais recomendações para relatar causalidade?
29
Análise qualitativa
29.1
Análise qualitativa
29.2
Representação de texto
29.2.1
O que é tokenização?
29.2.2
Modelagem com N-gramas
29.2.3
O que são n-gramas?
PARTE 6: ANÁLISES INFERENCIAIS
30
Análise inferencial
30.1
Raciocínio inferencial
30.1.1
O que é análise inferencial?
30.1.2
Quais são os tipos de raciocínio inferencial?
30.1.3
Quais são as questões fundamentais da análise inferencial?
30.2
Hipóteses científicas
30.2.1
O que é hipótese científica?
30.2.2
Quais são as fontes de ideias para gerar hipóteses científicas?
30.3
Hipóteses estatísticas
30.3.1
O que é hipótese nula?
30.3.2
O que é hipótese alternativa?
30.3.3
Qual hipótese está sendo testada?
30.4
Testes de hipóteses
30.4.1
Quais são os tipos de teste de hipóteses?
30.4.2
O que são testes unicaudais e bicaudais?
30.4.3
O que reportar após um teste de hipótese?
30.5
Intervalos de confiança e raciocínio de longo prazo
30.5.1
O que é um intervalo de confiança?
30.5.2
O que é raciocínio de longo prazo?
30.5.3
O que um intervalo de confiança não representa?
30.5.4
Qual a relação entre intervalos de confiança e testes de hipóteses?
30.5.5
Por que intervalos de confiança são centrais na inferência científica?
30.6
Comparações múltiplas
30.6.1
Como ajustar a análise inferencial para hipóteses múltiplas?
30.7
Inferência visual
30.7.1
O que é inferência visual?
30.7.2
Por que usar intervalos de confiança para inferência visual?
30.7.3
Como interpretar intervalos de confiança em uma figura?
30.8
Interpretação de análise inferencial
30.8.1
Como interpretar uma análise inferencial?
30.8.2
O que são resultados “positivos” e “negativos” em teste de hipótese?
30.8.3
Qual a importância de resultados “negativos”?
30.8.4
Resultados inconclusivos: Ausência de evidência ou evidência de ausência?
30.9
Erros de inferência I, II, S e M
30.9.1
O que são erros de inferência estatística?
30.9.2
O que são erros Tipo I e Tipo II?
30.9.3
O que são erros Tipo S e Tipo M?
31
Suposições inferenciais
31.1
Suposições gerais em análises inferenciais
31.1.1
Quais são as suposições gerais em análises inferenciais?
31.1.2
Quais são as suposições ao nível dos dados (condicionais ao modelo)?
31.1.3
Quais são as suposições ao nível do modelo?
31.1.4
Quais são as suposições ao nível do estudo?
31.2
Suposições implícitas e explícitas nos testes
31.2.1
Quais suposições implícitas são feitas nos testes estatísticos?
31.2.2
Quais suposições explícitas são feitas nos testes estatísticos?
31.3
Suposições causais que conectam dados observados a efeitos causais
31.3.1
Quais são as suposições causais que conectam dados observados a efeitos causais?
31.3.2
Qual a relação dessas suposições com as demais suposições inferenciais?
31.4
Diagnóstico e verificação
31.4.1
O que fazer quando suposições gerais falham?
31.4.2
O que fazer quando as suposições causais falham?
31.4.3
Como avaliar as suposições de uma regressão?
31.4.4
Como avaliar a independência entre variáveis?
31.5
Normalidade
31.5.1
Devemos testar as suposições de normalidade?
31.6
Escolha entre métodos paramétricos e não paramétricos
31.6.1
O que é análise paramétrica?
31.6.2
O que é análise não paramétrica?
31.6.3
Por que análises paramétricas são preferidas?
32
Tamanho do efeito
32.1
Tamanho do efeito
32.1.1
O que é o tamanho do efeito?
32.2
Tipos de tamanho do efeito
32.2.1
Quais são os tipos de tamanho do efeito?
32.2.2
Como interpretar um tamanho do efeito?
32.2.3
O que é a diferença de média bruta?
32.2.4
Correlações podem ser consideradas tamanhos de efeito?
32.2.5
O que é o
\(q\)
de Cohen?
32.2.6
O que o
\(g\)
no teste do sinal?
32.2.7
O que é o
\(h\)
de Cohen?
32.2.8
O que representa o tamanho de efeito
\(w\)
?
32.2.9
O que é o tamanho de efeito
\(f\)
em ANOVA?
32.2.10
O que é o tamanho de efeito
\(f^2\)
em regressão?
32.2.11
O que é a estatística
\(\Lambda\)
de Wilks na MANOVA?
32.2.12
Como escolher o tamanho de efeito adequado?
32.3
Conversão entre tamanhos do efeito
32.3.1
Como converter um tamanho de efeito em outro?
32.4
Efeitos bruto e padronizado
32.4.1
O que é tamanho do efeito bruto?
32.4.2
O que é tamanho do efeito padronizado?
33
P-valor
33.1
P-valor
33.1.1
O que é o P-valor?
33.1.2
O que o P-valor não é?
33.2
Significância estatística
33.2.1
O que é significância estatística?
33.3
Interpretação do P-valor
33.3.1
Como interpretar o P-valor?
33.3.2
Existe uma crítica lógica à significância estatística?
33.3.3
O que é “prova probabilística por contradição”?
33.3.4
Qual é o equívoco central?
33.3.5
O que isso implica para a interpretação do P-valor?
33.3.6
Qual a origem do ‘P<0,05’?
33.3.7
Quais são os complementos ou alternativas ao P-valor?
33.4
P-valor de 2ª geração
33.4.1
O que é o P-valor de 2ª geração?
33.4.2
Como definir a hipótese nula intervalar e
\(\delta\)
?
33.4.3
Como calcular o SGPV?
33.4.4
Como interpretar o SGPV?
33.4.5
Relação com testes de equivalência
33.4.6
Propriedades frequenciais e múltiplas comparações
33.5
Distribuição de confiança
33.5.1
O que é distribuição de confiança?
33.5.2
Como interpretar a distribuição de confiança?
PARTE 7: RELAÇÕES ENTRE VARIÁVEIS
34
Seleção de testes
34.1
Escolha de testes para análise inferencial
34.1.1
Por que escolher o teste é um problema?
34.1.2
Como selecionar os testes para a análise estatística inferencial?
35
Aderência à distribuição
35.1
Histograma com curva normal
35.2
Densidade Observada versus Normal
35.3
Q-Q Plot
35.4
Boxplot
35.5
Teste de Shapiro-Wilk (
\(W\)
)
35.6
Teste de Anderson-Darling (
\(A^2\)
)
35.7
Teste de Cramér-von Mises (
\(W^2\)
)
35.8
Teste de Lilliefors (
\(D\)
)
35.9
Teste de Jarque-Bera (
\(JB\)
)
35.10
Teste de Kolmogorov-Smirnov (
\(D\)
)
36
Descrição
36.1
Média e desvio-padrão
36.2
Mediana e intervalo interquartil
36.3
Variáveis categóricas
36.4
Descrição por grupos
36.5
Dados ausentes
37
Comparação
37.1
Teste
t
de Student
37.2
Teste
t
de Welch
37.3
Teste de Mann-Whitney
37.4
Teste de Wilcoxon
37.5
Análise de variância
37.6
Análise de variância (Welch)
37.7
Análise de variância (Kruskal-Wallis)
38
Associação
38.1
Testes de Qui-quadrado (
\(\chi^2\)
)
38.2
Teste exato (condicional) de Fisher
38.3
Teste exato (incondicional) de Barnard
38.4
Teste de McNemar
38.5
Teste de Cochran (
\(Q\)
)
38.6
Teste de Cochran–Armitage
38.7
Razão de changes (
\(OR\)
) e risco relativo (
\(RR\)
)
39
Correlação
39.1
Correlação de Pearson (
\(r\)
)
39.2
Correlação de Spearman (
\(\rho\)
)
39.3
Coeficiente de Kendall (
\(\tau\)
)
39.4
Correlação bisserial (
\(r_{s}\)
)
39.5
Correlação tetracórica (
\(r_{tet}\)
)
39.6
Correlação policórica (
\(r_{pol}\)
)
39.7
Correlação polisserial
39.8
Correlação de Cramér (
\(V\)
)
39.9
Coeficiente de Phi (
\(\phi\)
)
39.10
Coeficiente de Sheperd (
\(\phi\)
)
39.11
Correlação canônica
40
Redes
40.1
Análise de redes
40.1.1
O que é análise de rede?
40.1.2
Por que a análise de redes é útil em pesquisa científica?
40.1.3
Quais são as limitações da análise de redes?
40.2
Matriz de incidência
40.2.1
O que é uma matriz de incidência?
40.3
Elementos da rede
40.3.1
Quais são os principais elementos de uma rede?
40.3.2
Como as redes podem ser classificadas?
40.3.3
O que define a posição dos nodos em um grafo de rede?
40.4
Tipos de redes
40.4.1
Quais são os principais tipos de redes estatísticas?
40.4.2
Como reduzir associações espúrias em redes?
40.5
Métricas de rede
40.5.1
O que são medidas de centralidade?
41
Regressão
41.1
Regressão linear
41.2
Regressão logística
41.3
Regressão de Poisson
41.4
Regressão ordinal
41.5
Regressão com interação
41.6
Regressão com efeitos mistos
41.7
Comparação de modelos de regressão
42
Mediação
42.1
Mediação
42.2
PARTE 8: MODELAGEM
43
Modelos de regressão
43.1
Modelos e regressão
43.1.1
O que é modelagem?
43.1.2
O que é regressão?
43.1.3
Por que a escolha do modelo de regressão é complexa?
43.1.4
O que diferencia modelos clássicos e modernos em predição?
43.2
Preditores e desfechos
43.2.1
O que são desfechos de um modelo?
43.2.2
O que são preditores de um modelo?
43.2.3
Como selecionar preditores para um modelo?
43.3
Estruturas de análise de regressão
43.3.1
O que são análises de regressão simples?
43.3.2
O que são análises de regressão multivariável?
43.3.3
O que são análises de regressão multivariada?
43.3.4
O que são análises de regressão segmentada?
43.4
Tipos e famílias de regressão
43.4.1
O que são modelos de regressão linear?
43.4.2
O que são modelos de regressão polinomial?
43.4.3
O que são modelos de regressão não-linear?
43.4.4
O que são modelos de regressão logística?
43.4.5
O que são modelos de regressão multinomial?
43.4.6
O que são modelos de regressão ordinal?
43.4.7
O que são modelos de regressão de Poisson?
43.4.8
O que são modelos de regressão binomial negativa?
43.4.9
O que são modelos de regressão Gama?
43.5
Quais são os principais métodos de estimação em regressão linear?
43.5.1
O que é a regressão por mínimos quadrados ordinários (OLS)?
43.5.2
Por que utilizar modelos de regressão regularizados?
43.5.3
O que é a regressão Ridge?
43.5.4
O que é a regressão LASSO?
43.5.5
O que é a regressão
elastic net
?
43.6
Efeitos de modelos de regressão
43.6.1
O que é efeito fixo?
43.6.2
O que é efeito aleatório?
43.6.3
O que é efeito misto?
43.6.4
O que é efeito principal?
43.6.5
O que é efeito de interação?
43.6.6
O que é efeito de mediação?
43.6.7
O que é efeito de modificação?
43.7
Preparação de variáveis
43.7.1
Como preparar as variáveis categóricas para análise de regressão?
43.7.2
Por que é comum escolher a categoria mais frequente como referência em modelos epidemiológicos?
43.8
Colinearidade
43.8.1
O que é colinearidade?
43.8.2
Como identificar colinearidade na matriz de correlação?
43.9
Multicolinearidade
43.9.1
O que é multicolinearidade?
43.9.2
Como diagnosticar multicolinearidade de forma quantitativa?
43.9.3
O que fazer em caso de multicolinearidade elevada?
43.10
Redução de dimensionalidade
43.10.1
A correlação bivariada pode orientar a seleção de variáveis?
43.10.2
Variáveis sem significância estatística devem ser excluídas do modelo final?
43.10.3
Por que métodos de regressão gradual não são recomendados para seleção de variáveis?
43.10.4
O que pode ser feito para reduzir o número de variáveis candidatas?
43.10.5
Quando devemos forçar uma variável no modelo?
43.11
Seleção de variáveis em regressão
43.11.1
O que é seleção de variáveis em regressão?
43.11.2
Quais são os principais critérios de informação usados na seleção de variáveis?
43.11.3
Quais algoritmos podem ser usados para seleção automática?
43.12
Desempenho e estabilidade de modelos
43.12.1
Como avaliar o desempenho dos modelos?
43.12.2
Qual modelo alcança estabilidade mais rapidamente?
43.13
Comparação de modelos
43.13.1
Como comparar modelos estatísticos?
43.13.2
Como comparar modelos de aprendizagem de máquina?
43.14
Avaliação de modelos
43.14.1
Como avaliar a qualidade de ajuste de um modelo?
43.15
Validação de modelos
43.15.1
Como validar modelos estatísticos?
43.16
Calibração de modelos
43.16.1
Como calibrar modelos estatísticos?
44
Modelagem de sobrevida
44.1
Análise de sobrevida
44.1.1
O que é análise de sobrevida?
44.1.2
Quando usar análise de sobrevida?
44.2
Eventos
44.2.1
O que caracteriza um “evento” em análise de sobrevida?
44.3
Dados censurados
44.3.1
O que são dados censurados?
44.3.2
Quais são os tipos de censura de dados?
44.4
Medidas de associação em análise de sobrevida
44.4.1
O que é a função de sobrevida?
44.4.2
O que é a função de risco?
44.4.3
O que é a razão de risco (
hazard ratio
)?
44.4.4
Qual é a diferença entre modelos de Kaplan–Meier e Cox?
44.4.5
O que é o tempo médio de sobrevida restrito?
44.5
Modelo de Kaplan–Meier
44.5.1
O que é a curva de Kaplan-Meier?
44.5.2
Como interpretar as curvas de Kaplan–Meier?
44.6
Modelos de Cox
44.6.1
O que é o modelo de Cox?
44.6.2
Como interpretar o coeficiente do modelo de Cox?
45
Modelagem temporal
45.1
Modelos temporais
45.1.1
O que são modelos temporais?
45.1.2
Por que modelos temporais são importantes?
45.2
Estrutura temporal dos dados
45.2.1
O que é dependência temporal?
45.2.2
O que é autocorrelação?
45.3
Modelos lineares e não lineares
45.3.1
O que são modelos temporais lineares?
45.3.2
O que são modelos temporais não lineares?
45.3.3
Por que distinguir linearidade de não linearidade é difícil?
45.4
Testes de não linearidade
45.4.1
Como testar não linearidade em séries temporais?
45.4.2
O que é o método de dados substitutos?
45.4.3
Como funciona o método de dados substitutos?
45.4.4
O que é significância nesse contexto?
45.5
Hipóteses em modelos temporais
45.5.1
O que é uma hipótese nula em séries temporais?
45.5.2
Quais hipóteses nulas podem ser usadas?
45.6
Estatísticas em séries temporais
45.6.1
O que são estatísticas discriminantes?
45.6.2
Quais estatísticas podem ser usadas?
45.7
Limitações dos modelos temporais
45.7.1
Quais são as limitações dos modelos temporais?
45.8
Validação de modelos temporais
45.8.1
Como validar modelos temporais?
46
Modelagem espacial
46.1
Modelos espaciais
46.1.1
O que são modelos espaciais?
47
Modelagem estocástica
47.1
Modelos estocásticos
47.1.1
O que são modelos estocásticos?
47.1.2
O que são cadeias de Markov?
48
Modelagem estrutural
48.1
Modelos estruturais
48.1.1
O que é modelagem de equações estruturais (SEM)?
48.1.2
Em que a SEM difere de outras abordagens estatísticas?
48.2
Variáveis latentes
48.2.1
O que é uma variável latente?
48.2.2
O que é análise fatorial confirmatória (CFA)?
48.3
Aplicações avançadas
48.3.1
O que é modelo de curva de crescimento latente (LGC)?
48.3.2
O que é SEM Bayesiana?
48.3.3
O que é PLS-SEM?
48.3.4
O que caracteriza a PLS-SEM dentro da família da SEM?
48.3.5
Quando a PLS-SEM deve ser considerada?
48.4
Ajuste e avaliação do modelo
48.4.1
Quais são os principais índices de ajuste em SEM?
48.5
Problemas comuns na aplicação de SEM
48.5.1
Quais são problemas frequentes na aplicação de SEM?
48.5.2
Por que a especificação do modelo é crítica em SEM?
PARTE 9: REPRESENTAÇÃO, APRENDIZADO DE MÁQUINA E INTELIGÊNCIA ARTIFICIAL
49
Representações
49.1
Representações de dados e extração de atributos
49.1.1
Como representar texto como vetores?
49.1.2
O que é
one-hot
,
multi-hot
e
count encoding
?
50
Aprendizado de máquina
50.1
Aprendizado de máquina
50.1.1
O que é aprendizado de máquina?
50.2
Tipos de aprendizado
50.2.1
O que é aprendizado supervisionado?
50.2.2
O que é aprendizado não supervisionado?
50.2.3
O que é aprendizado por reforço?
50.2.4
Quais são os limites do progresso em classificadores supervisionados?
50.2.5
Quais problemas práticos limitam a generalização de classificadores?
50.3
Fluxo de desenvolvimento de modelos
50.3.1
Qual é o fluxo para descoberta científica usando aprendizado de máquina?
50.3.2
Qual é o fluxo de desenvolvimento de modelos de aprendizado de máquina?
50.3.3
O que são conjuntos de treinamento, validação e teste?
50.3.4
O que são hiperparâmetros?
50.4
Principais algoritmos
50.4.1
Quais são os principais algoritmos de aprendizado de máquina?
50.4.2
Por que estudos comparativos entre classificadores podem ser enganosos?
50.5
Regressão logística
50.5.1
O que é regressão logística?
50.5.2
Por que utilizar regressão logística em problemas de classificação?
50.6
Máquina de vetores de suporte
50.6.1
O que são máquinas de vetores de suporte?
50.7
K-nearest neighbours
50.7.1
O que é
k-nearest neighbours
?
50.8
Árvores de decisão
50.8.1
O que são árvores de decisão?
50.8.2
Quais são os principais usos de árvores de decisão?
50.8.3
Quais são os componentes básicos de uma árvore de decisão?
50.8.4
Como árvores de decisão realizam as divisões nos dados?
50.8.5
Como funcionam
splitting
,
stopping
e
pruning
?
50.8.6
Quais são as vantagens e limitações de árvores de decisão?
50.8.7
Espaço de decisão em árvores de decisão vs. regressão logística
50.9
Random forests
50.9.1
O que são
random forests
?
50.10
Ensembles
50.10.1
O que são
ensembles
?
50.11
K-means Clustering
50.11.1
O que é
K-means clustering
?
50.11.2
Existe um número ótimo de
clusters
?
50.11.3
Como escolher o número de
clusters
?
50.11.4
Por que o método do “cotovelo” pode ser problemático?
50.12
Análise de componentes principais
50.12.1
O que é análise de componentes principais?
50.13
Métricas de distância e similaridade
50.13.1
O que é uma métrica?
50.13.2
Quais são as principais métricas?
50.13.3
Como escolher a métrica adequada?
50.13.4
Quais métricas são indicadas para avaliar modelos preditivos?
50.13.5
Quais métricas são consideradas inadequadas?
50.14
Avaliação de modelos de classificação
50.14.1
Por que é importante avaliar o desempenho de classificação?
50.14.2
O que é uma matriz de confusão 2x2?
50.14.3
Como interpretar uma matriz de confusão 2x2?
50.14.4
Quais métricas caracterizam o desempenho de um classificador?
50.15
Baselines
em classificação
50.15.1
O que são
baselines
?
50.15.2
Por que é necessário comparar classificadores com um
baseline
?
50.15.3
Quais são os principais classificadores
baseline
?
50.15.4
Como o desbalanceamento de classes afeta o
baseline
?
50.15.5
Como usar
baselines
na avaliação de modelos?
50.16
Desbalanceamento de classes
50.16.1
O que é desbalanceamento de classes?
50.16.2
Por que o desbalanceamento de classes é um problema?
50.16.3
Como lidar com desbalanceamento de classes?
50.16.4
O desbalanceamento de classes afeta a calibração de modelos?
51
Redes neurais
51.1
Neurônios artificiais
51.1.1
O que são neurônios artificiais?
51.2
Rede neural artificial
51.2.1
O que é uma rede neural artificial?
51.3
Funções de ativação
51.3.1
Quais são as funções de ativação mais comuns?
51.4
Funções de perda
51.4.1
O que são funções de perda?
51.4.2
Quais são as funções de perda mais comuns?
51.5
Treinamento de redes neurais
51.5.1
O que significa treinar uma rede neural?
51.5.2
O que são os pesos em uma rede neural?
51.5.3
Como ocorre o ajuste iterativo dos pesos ao longo do treinamento?
51.5.4
Qual é o objetivo do treinamento em termos de minimização da função de perda?
51.5.5
O que é o gradiente descendente (
gradient descent
)?
51.5.6
Qual é a interpretação geométrica do gradiente descendente no espaço dos parâmetros?
51.5.7
Por que o gradiente indica a direção de maior redução da função de perda?
51.5.8
O que é o gradiente descendente estocástico (
stochastic gradient descent
, SGD)?
51.5.9
Por que o uso do conjunto de dados pode ser computacionalmente inviável?
51.5.10
O que são
mini-batches
e como eles são utilizados no treinamento?
51.5.11
De que forma o ruído introduzido pelo SGD pode atuar como um regularizador implícito?
51.5.12
O que é uma época (
epoch
) no treinamento de redes neurais?
51.5.13
O que define formalmente uma época durante o processo de treinamento?
51.5.14
Qual é a relação entre época, tamanho do batch e número de atualizações dos pesos?
51.5.15
Como o número de épocas influencia a convergência do modelo?
51.5.16
Como o número de épocas influencia ao risco de
overfitting
?
51.6
Espaço de decisão
51.6.1
O que é espaço de decisão?
51.6.2
Como o espaço de decisão é visualizado?
51.7
Redes neurais multicamadas
51.7.1
O que são redes neurais multicamadas?
51.8
Redes neurais profundas
51.8.1
O que são redes neurais profundas?
51.9
Redes neurais convolucionais
51.9.1
O que são redes neurais convolucionais?
51.9.2
O que é uma convolução?
51.9.3
O que é um filtro convolucional?
51.9.4
Por que convoluções reduzem o número de parâmetros?
52
Inteligência artificial
52.1
Inteligência artificial
52.1.1
O que é inteligência artificial?
52.2
Inteligência artificial explicável (
eXplainable Artificial Intelligence, XAI)
52.2.1
O que é inteligência artificial explicável?
52.2.2
Por que explicar modelos de IA?
52.3
Inteligência artificial generativa
52.3.1
O que são grandes modelos de linguagem (
large language models
, LLM)?
52.3.2
Como funcionam modelos os grandes modelos de linguagem?
52.4
Limitações fundamentais de modelos generativos
52.4.1
O que são alucinações em modelos generativos?
52.4.2
Por que modelos generativos alucinam?
52.4.3
Alucinações indicam erro do modelo?
52.4.4
Qual a diferença entre erro estatístico e alucinação?
52.4.5
Quais tipos de alucinação são mais comuns?
52.4.6
Por que alucinações são um problema prático?
52.4.7
É possível eliminar completamente as alucinações?
PARTE 10: PLANEJAMENTO DE ESTUDOS
53
Poder estatístico
53.1
Poder do teste
53.1.1
O que é poder do teste?
53.1.2
O que é análise de poder do teste?
53.1.3
Quando realizar a análise de poder do teste?
53.1.4
Por que a análise de poder do teste
post hoc
é inadequada?
53.1.5
O que pode ser realizado ao invés da análise de poder?
53.1.6
Por que o desequilíbrio entre grupos pode ser problemático para o poder do teste?
53.2
Poder observado
53.2.1
Qual é a relação entre poder observado e P-valor?
53.3
Poder de salvaguarda
53.3.1
O que é poder de salvaguarda?
53.3.2
Por que utilizar o poder de salvaguarda?
54
Tamanho da amostra
54.1
Tamanho da amostra
54.1.1
O que é tamanho da amostra?
54.1.2
Por que determinar o tamanho da amostra é importante?
54.1.3
Quais fatores devem ser considerados para determinar o tamanho da amostra?
54.1.4
Quais aspectos éticos estão envolvidos no tamanho da amostra?
54.2
Saturação em pesquisas qualitativas
54.2.1
O que é saturação de dados em pesquisas qualitativas?
54.2.2
Quais tipos de saturação existem?
54.2.3
Quantas entrevistas ou grupos focais são necessários para alcançar saturação?
54.2.4
Quais debates existem sobre o conceito de saturação?
54.2.5
Quais recomendações para tamanho de amostras de estudos qualitativos?
54.3
“Fome de dados”
54.3.1
O que significa “fome de dados”?
54.3.2
Por que a “fome de dados” é relevante?
54.4
Eventos por variável (EPV) em modelos preditivos
54.4.1
Quantos eventos por variável (EPV) são necessários?
54.4.2
O que acontece se não houver eventos suficientes?
54.5
Cálculo do tamanho da amostra
54.5.1
Como calcular o tamanho da amostra?
54.5.2
Como especificar o tamanho do efeito esperado?
54.6
Perdas de amostra
54.6.1
O que é perda de amostra?
54.6.2
Por que a perda de amostra é um problema?
54.6.3
Como evitar perda de amostra?
54.7
Ajustes no tamanho da amostra
54.7.1
Por que ajustar o tamanho da amostra?
54.7.2
Como ajustar para perda amostral?
54.8
Justificativa do tamanho da amostra
54.8.1
Como justificar o tamanho da amostra de um estudo?
54.8.2
Como justificar o tamanho da amostra em estudos qualitativos?
55
Plano de análise
55.1
Plano de análise estatística
55.1.1
O que é plano de análise estatística?
55.1.2
Qual é a relação entre pergunta científica e plano de análise?
55.1.3
Por que a pré-especificação do plano de análise é fundamental?
55.1.4
Como o plano de análise lida com dados perdidos?
55.2
Fluxo estatístico
55.2.1
O que é fluxo estatístico?
55.2.2
Quais etapas costumam compor um workflow estatístico?
55.2.3
Por que o workflow é importante para um Plano de Análise Estatística?
55.3
Estimandos
55.3.1
O que são estimandos e por que eles são importantes?
55.3.2
Qual é a diferença entre estimando teórico e estimando empírico?
55.3.3
Por que definir o estimando antes do método estatístico?
55.3.4
Quais componentes devem ser definidos em um estimando?
55.3.5
Qual é a relação entre estimando, estimador e método estatístico?
55.3.6
Como a definição explícita do estimando melhora o Plano de Análise Estatística?
55.3.7
Por que o estimando deve existir fora do modelo estatístico?
55.4
Diretrizes para redação
55.4.1
Quais são as diretrizes para redação de planos de análise estatística?
PARTE 11: DELINEAMENTOS E SÍNTESE DE EVIDÊNCIAS
56
Delineamento de estudos
56.1
Critérios de delineamento
56.1.1
Quais critérios são utilizados para classificar os delineamentos de estudos?
56.2
Alocação
56.2.1
O que é alocação?
56.2.2
Quais são os tipos de alocação?
56.2.3
O que é alocação oculta (allocation concealment)?
56.2.4
A alocação oculta é obrigatória em ensaios clínicos?
56.3
Mascaramento
56.3.1
O que é mascaramento?
56.3.2
Por que o mascaramento é tão importante?
56.3.3
Quem pode ser mascarado?
56.3.4
Quais são os tipos de mascaramento?
56.3.5
Qual é a diferença entre alocação oculta e mascaramento?
56.4
Pareamento
56.4.1
O que é pareamento?
56.5
Aleatorização
56.5.1
O que é aleatorização?
56.5.2
Quais são os métodos de aleatorização?
56.5.3
Quais são as limitações da aleatorização simples?
56.6
Taxonomia de estudos
56.6.1
Como podem ser classificados os estudos científicos?
56.7
Hierarquia da evidência científica
56.7.1
Quais são os modelos de hierarquia da evidência científica?
56.7.2
Quais são as limitações da hierarquia da evidência científica?
57
Simulação computacional
57.1
Simulações computacionais
57.1.1
O que são simulações computacionais?
57.1.2
Por que estudos de simulação devem ser tratados como experimentos científicos?
57.1.3
O que são estudos de simulação estatística?
57.1.4
Qual é o papel dos estudos de simulação em pesquisa científica?
57.1.5
Por que não avaliar métodos estatísticos apenas com dados reais?
57.1.6
Quais são as principais vantagens de estudos de simulação?
57.1.7
Quais são as limitações de estudos de simulação?
57.2
Simulações em todo o fluxo de trabalho estatístico
57.2.1
Qual é o papel das simulações no fluxo de trabalho estatístico?
57.2.2
Como as simulações auxiliam na especificação de modelos?
57.2.3
Como as simulações contribuem para a verificação de modelos?
57.2.4
Como as simulações podem ser utilizadas diretamente para inferência?
57.2.5
Como as simulações auxiliam na validação de modelos?
57.3
Métodos de simulação
57.3.1
Quais são os elementos fundamentais de um estudo de simulação?
57.3.2
O que é um cenário de simulação?
57.3.3
Quais são os principais elementos para avaliar a qualidade de um modelo de simulação?
57.3.4
Por que é necessário repetir muitas simulações?
57.3.5
Quais boas práticas devem ser seguidas em estudos de modelagem e simulação?
57.4
Método de Monte Carlo
57.4.1
O que é o método de Monte Carlo?
57.4.2
Como escolher a distribuição adequada em um estudo de simulação?
57.5
Avaliação de métodos estatísticos em simulações
57.5.1
Quais critérios são usados para avaliar métodos estatísticos em simulações?
57.5.2
O que é o erro padrão de Monte Carlo?
57.6
Diretrizes para redação
57.6.1
Quais são as diretrizes para redação de estudos de simulação computacional?
58
Pesquisa qualitativa
58.1
Pesquisa qualitativa
58.1.1
O que é pesquisa qualitativa?
58.2
Diretrizes para redação
58.2.1
Quais são as diretrizes para redação de estudos de propriedades psicométricas?
59
Estudo Delphi
59.1
Estudo Delphi
59.1.1
O que é o método Delphi?
59.2
Diretrizes para redação
59.2.1
Quais são as diretrizes para redação de estudos Delphi?
60
Ciência cidadã
60.1
Introdução
60.1.1
O que é Ciência Cidadã?
61
Estudo observacional
61.1
Características
61.1.1
Quais são as características de estudos observacionais?
61.2
Emulação de ensaio-alvo
61.2.1
O que é uma emulação de ensaio-alvo?
61.2.2
Por que utilizar
Target Trial Emulation
?
61.2.3
Quais elementos devem ser definidos em uma emulação de ensaio-alvo?
61.2.4
O que é o tempo zero?
61.2.5
O que é viés do usuário prevalente?
61.2.6
O que é viés de tempo imortal?
61.2.7
Como a aleatorização é emulada em ensaio-alvo?
61.2.8
Quais são as vantagens da emulação de ensaio-alvo?
61.2.9
Quais são as limitações da emulação de ensaio-alvo?
61.2.10
Quando utilizar a emulação de ensaio-alvo?
61.2.11
A emulação de ensaio-alvo permite inferência causal?
61.3
Diretrizes para redação
61.3.1
Quais são as diretrizes para redação de estudos observacionais?
62
Pesquisa por levantamento
62.1
Pesquisa por levantamento
62.1.1
O que é pesquisa por levantamento?
62.1.2
Quando utilizar um levantamento?
62.2
Levantamentos transversais
62.3
Levantamentos longitudinais
62.4
Painéis
62.5
Como melhorar a taxa de resposta?
62.6
Diretrizes para redação
62.6.1
Quais são as diretrizes para redação de estudos de levantamento?
63
Estudo metodológico
63.1
Concordância
63.1.1
O que é concordância?
63.1.2
Quais métodos são adequados para análise de concordância de variáveis dicotômicas?
63.1.3
Quais métodos são adequados para análise de concordância de variáveis categóricas?
63.1.4
Quais métodos são adequados para análise de concordância de variáveis ordinais?
63.1.5
Quais métodos são adequados para análise de concordância de variáveis contínuas?
63.1.6
Quais métodos são adequados para modelagem de concordância?
63.1.7
Quais métodos não são adequados para análise de concordância de variáveis contínuas?
63.1.8
Quais métodos não são adequados para análise de concordância de variáveis dicotômicas?
63.2
Confiabilidade
63.2.1
O que é confiabilidade?
63.2.2
Quais métodos são adequados para análise de confiabilidade?
63.3
Diretrizes para redação
63.3.1
Quais são as diretrizes para redação de estudos de propriedades psicométricas?
64
Estudo psicométrico
64.1
Características
64.1.1
O que são propriedades psicométricas?
64.2
Análise fatorial exploratória
64.2.1
O que é análise fatorial exploratória?
64.3
Análise fatorial confirmatória
64.3.1
O que é análise fatorial confirmatória?
64.4
Validade de conteúdo
64.4.1
O que é validade interna?
64.4.2
O que é validade externa?
64.4.3
Que fatores afetam a validade?
64.4.4
Como avaliar a validade de um estudo?
64.4.5
Qual é a importância da validade externa em ensaios quase-experimentais?
64.5
Validade de face
64.5.1
O que é validade de face?
64.6
Validade do construto
64.6.1
O que é construto?
64.7
Validade fatorial
64.7.1
O que é validade fatorial?
64.8
Validade convergente
64.8.1
O que é validade convergente?
64.9
Validade discriminante
64.9.1
O que é validade discriminante?
64.10
Validade de critério
64.10.1
O que é validade de critério?
64.11
Validade concorrente
64.11.1
O que é concorrente?
64.11.2
O que é validade concorrente?
64.11.3
O que é validade preditiva?
64.12
Responsividade
64.12.1
O que é responsividade?
64.13
Diretrizes para redação
64.13.1
Quais são as diretrizes para redação de estudos de propriedades psicométricas?
65
Desempenho diagnóstico
65.1
Tabelas 2x2
65.1.1
O que é uma tabela de confusão 2x2?
65.1.2
Como analisar o desempenho diagnóstico em tabelas 2x2?
65.1.3
Quais probabilidades caracterizam o desempenho diagnóstico de um teste em tabelas 2x2?
65.2
Tabelas 2x3
65.2.1
O que é uma tabela de confusão 2x3?
65.2.2
Como as regiões POS, BND e NEG são definidas?
65.2.3
Qual é o formato de uma tabela 2×3?
65.2.4
Quais são as medidas básicas na 2×3?
65.2.5
Como escolher os limiares
\(\alpha\)
e
\(\beta\)
?
65.2.6
Quando preferir 3-vias em vez de 2×2?
65.3
Curvas ROC
65.3.1
O que representa a curva ROC?
65.3.2
Quais são os tipos de curva ROC?
65.3.3
Como definir o melhor ponto de corte?
65.3.4
O que é a área sob a curva (AUROC)?
65.3.5
Como calcular a AUC?
65.3.6
Como interpretar a área sob a curva (ROC)?
65.3.7
Por que uma AUC menor que 0.5 está errada?
65.3.8
Como analisar o desempenho diagnóstico em desfechos com distribuição trimodal na população?
65.4
Interpretação da validade de um teste
65.4.1
Que itens devem ser verificados na interpretação de um estudo de validade?
65.5
Diretrizes para redação
65.5.1
Quais são as diretrizes para redação de estudos diagnósticos?
66
n-de-1
66.1
Ensaio n-de-1
66.1.1
O que são ensaios n-de-1?
66.1.2
Quando é apropriado conduzir ensaios n-de-1?
66.1.3
Qual a relevância dos ensaios n-de-1?
66.2
Aspectos metodológicos
66.2.1
Quais são os principais aspectos do delineamento de ensaios n-de-1?
66.2.2
Quantos períodos são usualmente utilizados?
66.2.3
Como é feita a aleatorização?
66.2.4
Quais perguntas de inferência podem ser respondidas?
66.3
Análise de dados
66.3.1
Como são feitas as análises?
66.3.2
Quais métodos estatísticos têm sido utilizados recentemente?
66.3.3
É adequado utilizar P-valores em ensaios n-de-1?
66.3.4
Como os dados de ensaios n-de-1 podem ser visualizados?
66.3.5
Quais métodos estatísticos são usados na análise?
66.4
Abordagem meta-analítica
66.4.1
Como um conjunto de ensaios n-de-1 pode ser analisado conjuntamente?
66.4.2
Por que a meta-análise com efeitos aleatórios produz intervalos de confiança mais amplos?
66.4.3
Qual é a principal vantagem da abordagem meta-analítica?
66.5
Limitações e cuidados
66.5.1
Quais são os principais desafios dos ensaios n-de-1?
67
Ensaios cruzados
67.1
Características
67.1.1
O que é um ensaio cruzado?
67.1.2
Qual é a principal característica metodológica de ensaios cruzados?
67.1.3
Quais são os principais componentes de um ensaio cruzado?
67.1.4
Quais são as principais vantagens dos ensaios cruzados?
67.1.5
Quais são as limitações dos ensaios cruzados?
67.2
Análise estatística
67.2.1
Quais são as considerações para análise estatística de ensaios cruzados?
67.2.2
Como os efeitos do tratamento são avaliados em ensaios cruzados?
67.2.3
Como verificar a presença de efeitos de
carryover
?
67.2.4
O que fazer quando há evidência de
carryover
?
67.2.5
Como lidar com dados perdidos em ensaios cruzados?
67.3
Extensões do delineamento
67.3.1
Existem variações do ensaio cruzado?
67.4
Diretrizes para redação
67.4.1
Quais são as diretrizes para redação de ensaios cruzados?
68
Ensaios quase-experimentais
68.1
Características
68.1.1
Quais são as características de ensaios quase-experimentais?
68.2
Séries temporais interrompidas
68.2.1
O que são séries temporais interrompidas?
68.2.2
O que são séries temporais interrompidas controladas?
68.2.3
Quando utilizar séries temporais interrompidas?
68.2.4
Como selecionar o modelo em séries temporais interrompidas?
68.2.5
O que é o modelo contrafactual em séries temporais interrompidas?
68.2.6
O que representam mudanças de nível e inclinação em séries temporais interrompidas?
68.2.7
Por que especificar o modelo de impacto a priori?
68.2.8
Como avaliar heterogeneidade de efeito em séries temporais interrompidas?
68.2.9
Quais são os principais pressupostos de séries temporais interrompidas?
68.2.10
Quais são as limitações de modelos ITS simples?
68.2.11
Quais são as principais ameaças à validade em séries temporais interrompidas?
68.2.12
O que é autocorrelação em séries temporais interrompidas?
68.2.13
Como controlar sazonalidade em séries temporais interrompidas?
68.3
Diretrizes para redação
68.3.1
Quais são as diretrizes para redação de ensaios quase-experimentais?
69
Ensaios experimentais
69.1
Ensaio experimental aleatorizado
69.1.1
Quais são as características de ensaios experimentais aleatorizados?
69.1.2
Quais são as estratégias metodológicas para reduzir vieses?
69.2
Modelos de análise de comparação
69.2.1
Que modelos podem ser utilizados para comparações?
69.3
Comparação na linha de base
69.3.1
O que são dados na linha de base?
69.3.2
O que é comparação entre grupos na linha de base?
69.3.3
Quais são as razões para diferenças entre grupos de tratamento nas (co)variáveis na linha de base?
69.3.4
Para quê comparar grupos na linha de base?
69.3.5
Quais são as limitações da comparação entre grupos na linha de base?
69.3.6
Por que não se deve comparar grupos na linha de base?
69.3.7
Como lidar com potenciais diferenças entre grupos de tratamento nas (co)variáveis na linha de base?
69.4
Comparação intragrupos
69.4.1
Por que não se deve comparar intragrupos (pré - pós)??
69.5
Comparação entre grupos
69.5.1
O que é comparação entre grupos??
69.5.2
O que pode ser comparado entre grupos?
69.5.3
Qual é a comparação entre grupos mais adequada?
69.6
Comparação de subgrupos
69.6.1
O que é comparação de subgrupos?
69.6.2
Como realizar a comparação de subgrupos?
69.6.3
Como interpretar a comparação de subgrupos?
69.7
Efeito de interação
69.7.1
Por que analisar o efeito de interação?
69.7.2
Quando usar o termo de interação?
69.8
Ajuste de covariáveis
69.8.1
Quais variáveis devem ser utilizadas no ajuste de covariáveis?
69.8.2
Quais os benefícios do ajuste de covariáveis?
69.8.3
Quais os riscos do ajuste de covariáveis?
69.9
Imputação de dados perdidos
69.9.1
Como lidar com os dados perdidos em desfechos?
69.9.2
Como lidar com os dados perdidos em covariáveis?
69.10
Diretrizes para redação
69.10.1
Quais são as diretrizes para redação de ensaios experimentais?
70
Revisão sistemática
70.1
Tipologia de revisões
70.1.1
Qual é a tipologia de revisões?
70.2
Revisão sistemática de literatura
70.2.1
O que é revisão sistemática?
70.3
Tipos de revisão sistemática
70.3.1
Quais são os tipos de revisão sistemática?
70.3.2
Quais delineamentos de revisão parecem mas não são revisões sistemáticas?
70.4
Diretrizes para redação
70.4.1
Quais são as diretrizes para revisão sistemática?
71
Meta-análise
71.1
Características
71.1.1
O que é meta-análise?
71.2
Modelos de meta-análise
71.2.1
Quais são os principais modelos de meta-análise?
71.3
Conversão de Medidas em Meta-análises
71.3.1
O que fazer quando os estudos apresentam resultados com diferentes parâmetros?
71.4
Interpretação de efeitos em meta-análise
71.4.1
Como avaliar a variação do tamanho do efeito?
71.4.2
Como avaliar a heterogeneidade entre os estudos?
71.5
Forest plot
71.5.1
O que é
forest plot
?
71.5.2
Quais são as seis colunas básicas que um
forest plot
geralmente apresenta?
71.5.3
Como diferenciar um desfecho binário de um contínuo em um
forest plot
?
71.5.4
O que representa o ponto central da caixa e o tamanho desta no gráfico?
71.5.5
Qual é o significado da linha vertical do “nenhum efeito”?
71.5.6
Como interpretar o diamante na parte inferior do
forest plot
?
71.5.7
Como a heterogeneidade pode ser avaliada no
forest plot
?
71.5.8
Quais são as interpretações usuais para os valores de heterogeneidade?
71.6
Crosshair
71.6.1
O que é
crosshair
?
71.7
Funnel plot
71.7.1
O que é
funnel plot
?
71.7.2
O que é viés de publicação?
71.7.3
Quais métodos podem ser usados para identificar viés de publicação?
71.7.4
A assimetria do
funnel plot
indica sempre viés de publicação?
71.7.5
O que é
trim and fill
?
71.8
Testes de assimetria do
funnel plot
71.8.1
O que é o teste de Egger?
71.8.2
O que é o teste de Peters?
71.8.3
Quais são as recomendações para testar a assimetria?
71.8.4
Como interpretar os resultados de testes de viés de publicação?
71.9
Diretrizes para redação
71.9.1
Quais são as diretrizes para redação de meta-análises?
72
Revisão guarda-chuva
72.1
Revisão guarda-chuva
72.1.1
O que é revisão guarda-chuva?
72.2
Diretrizes para redação
72.2.1
Quais são as diretrizes para revisão sistemática?
73
Análise de custo-efetividade
73.1
Análise de Custo-efetividade
73.1.1
O que é análise de custo-efetividade?
PRODUÇÃO DO AUTOR
Produção do autor
Artigos em periódicos científicos
Preprints
Resumos publicados em eventos científicos
Livros
Livros editorados
Capítulos de livro
Programas de computador
Bancos de dados
Aulas
Palestras
Outros
REFERÊNCIAS
Fontes externas
Fontes de informação externas
American Heart Association
American Physiological Society
American Statistical Association
British Medicine Journal
Enhancing the QUality And Transparency Of health Research Network
Journal of the Amercan Medical Association
Nature Publishing Group
Oxford Reference
Royal Statistical Society
Statistics in Medicine
BMC Trials
The Journal of Applied Statistics in the Pharmaceutical Industry
Referências
Publicado com Bookdown
Ciência com R
PARTE 7: RELAÇÕES ENTRE VARIÁVEIS
Como identificar padrões, associações e efeitos nos dados