Capítulo 17 Distribuições e parâmetros


17.1 Fontes de variabilidade


17.1.1 O que são fontes de variabilidade?

  • A variabilidade observada nos dados não surge de uma única causa, mas de diferentes processos que atuam simultaneamente durante a geração e a coleta dos dados.193

  • Compreender de onde vem a variação é essencial para interpretar distribuições, construir modelos e realizar inferência.193

  • A distribuição dos dados pode ser entendida como uma descrição da variabilidade resultante desses processos.193


17.1.2 Quais são as principais fontes de variabilidade?

  • Variabilidade real: resulta de diferenças reais entre indivíduos ou unidades observadas.193

  • Variabilidade de medição: decorre de limitações ou imperfeições nos instrumentos e métodos de medição. Mesmo quando o objeto medido não muda, repetidas medições podem produzir valores ligeiramente diferentes.193

  • Variabilidade amostral: surge porque diferentes amostras extraídas da mesma população podem produzir resultados distintos.193

  • Variabilidade experimental ou ambiental: relaciona-se a mudanças nas condições sob as quais os dados são obtidos, como temperatura, tempo, operador ou local de coleta.193

  • Variabilidade aleatória: refere-se à componente imprevisível associada ao acaso em processos naturais ou experimentais.193


17.1.3 Por que identificar as fontes de variabilidade é importante?

  • Permite distinguir entre variação real do fenômeno e ruído introduzido pelo processo de medição ou amostragem.193

  • Ajuda a escolher modelos estatísticos adequados para representar os dados.193

  • Orienta o desenho de experimentos e estratégias de amostragem para reduzir fontes indesejadas de variação.193

  • Fundamenta a interpretação das distribuições empíricas e teóricas utilizadas na inferência estatística.193


17.2 Distribuições de probabilidade


17.2.1 O que são distribuições de probabilidade?

  • A distribuição é o padrão de variação em uma variável ou conjunto de variáveis representado pelos dados.193

  • Uma distribuição de probabilidade é uma função que descreve os valores possíveis ou o intervalo de valores de uma variável (eixo horizontal) e a probabilidade ou frequência relativa com que os valores ocorrem (eixo vertical).136


17.2.2 Como representar distribuições de probabilidade?

  • Tabelas de frequência, polígonos de frequência, gráficos de barras, histogramas e boxplots são formas de representar distribuições de probabilidade.194

  • Tabelas de frequência mostram as categorias de medição e o número de observações em cada uma. É necessário conhecer o intervalo de valores (mínimo e máximo), que é dividido em intervalos arbitrários chamados “intervalos de classe”.194

  • Se houver muitos intervalos, não haverá redução significativa na quantidade de dados, e pequenas variações serão perceptíveis. Se houver poucos intervalos, a forma da distribuição não poderá ser adequadamente determinada.194

  • A quantidade de intervalos pode ser determinada pelo método de Sturges, que é dado pela fórmula \(k = 1 + 3.322 \times \log_{10}(n)\), onde \(k\) é o número de intervalos e \(n\) é o número de observações.195

  • A quantidade de intervalos pode ser determinada pelo método de Scott, que é dado pela fórmula \(h = 3.5 \times \text{sd}(x) \times n^{-1/3}\), onde \(h\) é a largura do intervalo, \(\text{sd}(x)\) é o desvio-padrão e \(n\) é o número de observações.196

  • A quantidade de intervalos pode ser determinada pelo método de Freedman-Diaconis, que é dado pela fórmula \(h = 2 \times \text{IQR}(x) \times n^{-1/3}\), onde \(h\) é a largura do intervalo, \(\text{IQR}(x)\) é o intervalo interquartil e \(n\) é o número de observações.197


Histogramas com diferentes métodos de binning.: Sturges, Scott e Freedman-Diaconis.

Figura 17.1: Histogramas com diferentes métodos de binning.: Sturges, Scott e Freedman-Diaconis.


  • A largura das classes pode ser determinada dividindo o intervalo total de observações pelo número de classes. Larguras desiguais podem ser usadas quando existirem grandes lacunas nos dados ou em contextos específicos. Os intervalos devem ser mutuamente exclusivos e não sobrepostos (ex.: <5, >10).194

  • Polígonos de frequência são gráficos de linhas que conectam os pontos médios de cada barra do histograma. Eles são úteis para comparar duas ou mais distribuições de frequência.194

  • Gráficos de barra verticais ou horizontais representam a distribuição de frequências de uma variável categórica. A altura de cada barra é proporcional à frequência da classe. A largura da barra é igual à largura da classe.194

  • Histogramas representam a distribuição de frequências de uma variável contínua. A altura de cada barra é proporcional à frequência da classe. A largura da barra é igual à largura da classe. A área de cada barra é proporcional à frequência da classe. A área total do histograma é igual ao número total de observações.194

  • Boxplots representam a distribuição de frequências de uma variável contínua. A linha central representa a mediana (Q2). A caixa inferior representa o primeiro quartil (Q1) e a caixa superior o terceiro quartil (Q3). Observações além de 1,5 vezes o intervalo interquartil (IQR) são representadas como valores atípicos.194




17.2.3 Quais características definem uma distribuição?

  • Uma distribuição pode ser definida por modelos matemáticos e caracterizada por parâmetros de tendência central, dispersão, simetria e curtose.REF?


17.3 Tipos de distribuições


17.3.1 O que são distribuições empíricas?

  • Distribuições empíricas são obtidas diretamente a partir dos dados observados, sendo geralmente representadas por histogramas, tabelas de frequência ou funções de distribuição empírica.193


17.3.2 O que são distribuições teóricas?

  • Distribuições teóricas correspondem a modelos matemáticos utilizados para representar o processo gerador dos dados, como as distribuições normal, binomial ou Poisson.193

  • A comparação entre distribuições empíricas e modelos teóricos é um passo fundamental na modelagem estatística e na inferência.193


17.3.3 O que são distribuições amostrais?

  • Distribuição amostral descreve a distribuição de uma estatística (como a média ou a proporção) quando calculada em múltiplas amostras da mesma população.193

  • As distribuições amostrais permitem quantificar a variabilidade associada às estimativas e constituem a base teórica para intervalos de confiança e testes de hipótese.193


17.3.4 Por que todas as distribuições são condicionais?

  • Uma distribuição descreve a variabilidade de uma variável sob determinadas condições ou suposições.193

  • Portanto, toda distribuição deve ser entendida como condicional ao processo gerador dos dados, ao modelo adotado ou às informações disponíveis.193

  • Na inferência estatística, muitas distribuições são condicionais aos parâmetros desconhecidos do modelo, como ocorre na distribuição amostral da média ou na distribuição binomial condicionada à probabilidade de sucesso.193


17.4 Distribuições univariadas


17.4.1 Quais são as distribuições mais comuns?

  • Distribuções discretas:

    • Bernoulli: resultado de um único teste com dois possíveis desfechos (sucesso ou fracasso).REF?

    • Binomial: número de sucessos em n tentativas independentes.REF?

    • Geométrica: número de tentativas necessárias até a ocorrência do primeiro sucesso.REF?

    • Binomial negativa: número de testes até o k-ésimo sucesso.REF?

    • Hipergeométrica: número de indivíduos na amostra tomados sem reposição.REF?

    • Poisson: número de eventos em um intervalo de tempo fixo.REF?

    • Uniforme: resultados (finitos) que são igualmente prováveis.REF?

    • Multinomial: resultados de múltiplos testes com mais de dois possíveis desfechos.REF?


Distribuições discretas e suas funções de probabilidade.

Figura 17.2: Distribuições discretas e suas funções de probabilidade.


  • Distribuições contínuas:


Distribuições contínuas básicas e suas funções de densidade.

Figura 17.3: Distribuições contínuas básicas e suas funções de densidade.


Distribuições contínuas aproximadas e suas funções de densidade.

Figura 17.4: Distribuições contínuas aproximadas e suas funções de densidade.


Distribuições contínuas aproximadas e suas funções de densidade.

Figura 17.5: Distribuições contínuas aproximadas e suas funções de densidade.


Distribuições contínuas para inferência e suas funções de densidade.

Figura 17.6: Distribuições contínuas para inferência e suas funções de densidade.


Distribuições contínuas para dados específicos e suas funções de densidade.

Figura 17.7: Distribuições contínuas para dados específicos e suas funções de densidade.


Distribuições contínuas para probabilidades e proporções e suas funções de densidade.

Figura 17.8: Distribuições contínuas para probabilidades e proporções e suas funções de densidade.


Distribuições contínuas com caudas pesadas e suas funções de densidade.

Figura 17.9: Distribuições contínuas com caudas pesadas e suas funções de densidade.


17.4.2 Quais são as funções de uma distribuição?

  • Função de massa de probabilidade (probability mass function, pmf) para variáveis discretas.REF?

  • Função de densidade de probabilidade (probability density function, pdf) para variáveis contínuas.REF?

  • Função de distribuição acumulada (cumulative distribution function, cdf).REF?

  • Função quantílica (quantile function).REF?

  • Função geradora de números aleatórios.REF?





17.4.3 O que é a distribuição normal?

  • A distribuição normal (ou gaussiana) é uma distribuição com desvios simétricos positivos e negativos em torno de um valor central.137

  • A relação entre média e desvio-padrão permite interpretar a dispersão dos dados em distribuições aproximadamente normais. A regra empírica estabelece que cerca de 68,2% dos valores situam-se no intervalo \(\bar{x} \pm \sigma\), cerca de 95,4% no intervalo \(\bar{x} \pm 2\sigma\).137,202

  • O desvio-padrão fornece uma medida direta da variabilidade dos dados em torno da média, permitindo avaliar quão dispersos ou concentrados estão os valores observados em uma amostra.202


Distribuições e funções de probabilidade.

Figura 17.10: Distribuições e funções de probabilidade.


17.4.4 Que métodos podem ser utilizados para identificar a normalidade da distribuição?

  • Histogramas.136

  • Gráficos Q-Q.136

  • Testes de hipótese nula:136

    • Kolmogorov-Smirnov

    • Shapiro-Wilk

    • Anderson-Darling


Distribuição normal e métodos de visualização e testes de normalidade.

Figura 17.11: Distribuição normal e métodos de visualização e testes de normalidade.


17.5 Distribuições bivariadas


17.5.1 O que são distribuições bivariadas?


Distribuição normal bivariada e amostra simulada com histogramas marginais.

Figura 17.12: Distribuição normal bivariada e amostra simulada com histogramas marginais.


17.6 Distribuições multivariadas


17.6.1 O que são distribuições multivariadas?

  • Distribuições multivariadas descrevem a probabilidade conjunta de duas ou mais variáveis aleatórias.REF?

  • Exemplos de distribuições multivariadas incluem a distribuição normal multivariada, a distribuição t multivariada, a distribuição binomial multinomial e a distribuição de Dirichlet.REF?


17.7 Parâmetros


17.7.1 O que são parâmetros?

  • Parâmetros são informações que definem um modelo teórico, como propriedades de uma coleção de indivíduos.135

  • Parâmetros definem características de uma população inteira, tipicamente não observados por ser inviável ter acesso a todos os indivíduos que constituem tal população.136



17.7.2 Que parâmetros podem ser estimados?

  • Parâmetros de tendência central.137,203

  • Parâmetros de dispersão.137,203,204

  • Parâmetros de proporção.137,203,205,205

  • Parâmetros de distribuição.203

  • Parâmetros de extremos.137



17.8 Tendência central


17.8.1 Que parâmetros de tendência central podem ser estimados?


\[\begin{equation} \tag{17.1} \bar{x} = \frac{\sum_{i=1}^{n} x_i}{n} \end{equation}\]


\[\begin{equation} \tag{17.2} \bar{x}_p = \frac{\sum_{i=1}^{n} w_i x_i}{\sum_{i=1}^{n} w_i} \end{equation}\]


\[\begin{equation} \tag{17.3} \bar{x}_g = \left( \prod_{i=1}^{n} x_i \right)^{\frac{1}{n}} \end{equation}\]


\[\begin{equation} \tag{17.4} \bar{x}_h = \frac{n}{\sum_{i=1}^{n} \frac{1}{x_i}} \end{equation}\]



\[\begin{equation} \tag{17.5} \tilde{x} = \begin{cases} x_{\left(\frac{n+1}{2}\right)}, & \text{se } n \text{ é ímpar} \\ \frac{x_{\left(\frac{n}{2}\right)} + x_{\left(\frac{n}{2} + 1\right)}}{2}, & \text{se } n \text{ é par} \end{cases} \end{equation}\]


  • Moda (17.6), onde \(f(x)\) é a função de frequência absoluta ou relativa e \(x_1, x_2, \ldots, x_n\) são os valores observados.137,203,207


\[\begin{equation} \tag{17.6} \operatorname{Mo} \in \arg\max_{x \in \{x_1,\ldots,x_n\}} f(x) \end{equation}\]


  • Moda (dados agrupados) (17.7), onde: \(L\) = limite inferior da classe modal; \(f_1\) = frequência da classe modal; \(f_0\) = frequência da classe anterior à classe modal; \(f_2\) = frequência da classe posterior à classe modal; \(h\) = amplitude da classe modal.


\[\begin{equation} \tag{17.7} \operatorname{Mo} = L + \frac{(f_1 - f_0)}{(f_1 - f_0) + (f_1 - f_2)} \cdot h \end{equation}\]


  • A posição relativa das medidas de tendência central (média, mediana e moda) depende da forma da distribuição.207

  • Em uma distribuição normal, as três medidas são idênticas.207

  • A média é sempre puxada para os valores extremos, por isso é deslocada para a cauda em distribuições assimétricas.207

  • A mediana fica entre a média e a moda em distribuições assimétricas.207

  • A moda é o valor mais frequente e, portanto, se localiza no pico da distribuição assimétrica.207

  • Uma distribuição pode uma moda (unimodal), duas modas (bimodal) ou três ou mais modas (multimodal), indicando a presença de mais de um valor com alta frequência.207


Distribuições unimodal, bimodal e multimodal.

Figura 17.13: Distribuições unimodal, bimodal e multimodal.


Parâmetros de tendência central em distribuições assimétricas e normais.

Figura 17.14: Parâmetros de tendência central em distribuições assimétricas e normais.



17.8.2 Como escolher o parâmetro de tendência central?

  • A mediana é preferida à média quando existem poucos valores extremos na distribuição, alguns valores são indeterminados, ou há uma distribuição aberta, ou os dados são medidos em uma escala ordinal.207

  • A moda é preferida quando os dados são medidos em uma escala nominal.207

  • A média geométrica é preferida quando os dados são medidos em uma escala logarítmica.207


17.9 Dispersão


17.9.1 Que parâmetros de dispersão podem ser estimados?


\[\begin{equation} \tag{17.8} s^2 = \frac{\sum_{i=1}^{n} (x_i - \bar{x})^2}{n-1} \end{equation}\]



\[\begin{equation} \tag{17.9} s = \sqrt{\frac{\sum_{i=1}^{n} (x_i - \bar{x})^2}{n-1}} \end{equation}\]



\[\begin{equation} \tag{17.10} A = x_{\max} - x_{\min} \end{equation}\]



\[\begin{equation} \tag{17.11} IQR = Q_3 - Q_1 \end{equation}\]


Parâmetros de dispersão em distribuições normais.

Figura 17.15: Parâmetros de dispersão em distribuições normais.




17.9.2 Como escolher o parâmetro de dispersão?

  • Desvio-padrão \(\sigma\) é apropriado quando a média é utilizada como parâmetro de tendência central em distribuições simétricas.209

  • Amplitude ou intervalo interquartil são apropriadas para variáveis ordinais ou distribuições assimétricas.209


17.9.3 O que é a correção de Bessel para variância?

  • Correção de Bessel é um ajuste feito no denominador da fórmula de variância da amostra — ou seja, o número de graus de liberdade — para evitar que a variância amostral seja menor do que a variância populacional.210

  • A correção de Bessel é feita subtraindo-se 1 do número de observações da amostra, ou seja, \(n - 1\) (17.12).210


\[\begin{equation} \tag{17.12} s^2 = \frac{\sum_{i=1}^{n} (x_i - \bar{x})^2}{n-1} \end{equation}\]


17.9.4 Por que a correção de Bessel para variância é importante?

  • A correção de Bessel é importante porque a variância amostral tende a ser menor do que a variância populacional, especialmente em amostras pequenas.210

  • A correção de Bessel ajuda a garantir que a variância amostral seja uma estimativa mais precisa da variância populacional, o que é fundamental para a validade dos testes estatísticos e das inferências feitas a partir da amostra.210


17.10 Proporção


17.10.1 Que parâmetros de proporção podem ser estimados?


\[\begin{equation} \tag{17.13} f_i = n_i \end{equation}\]



\[\begin{equation} \tag{17.14} fr_i = \frac{n_i}{N} \end{equation}\]


  • Percentil (17.15), onde \(k\) é o percentil desejado (0 a 100) e \(n\) é o número total de observações na amostra.137,203,205


\[\begin{equation} \tag{17.15} P_k = x_{\left(\frac{k}{100} \cdot (n+1)\right)} \end{equation}\]


  • Quantil: é o ponto de corte que define a divisão da amostra em grupos de tamanhos iguais. Portanto, não se referem aos grupos em si, mas aos valores que os dividem:205

    • Tercil: 2 valores que dividem a amostra em 3 grupos de tamanhos iguais.205

    • Quartil: 3 valores que dividem a amostra em 4 grupos de tamanhos iguais.205

    • Quintil: 4 valores que dividem a amostra em 5 grupos de tamanhos iguais.205

    • Decil: 9 valores que dividem a amostra em 10 grupos de tamanhos iguais.205





17.11 Extremos


17.11.1 Que parâmetros extremos podem ser estimados?


\[\begin{equation} \tag{17.16} \text{Mínimo} = \min(x_1, x_2, \ldots, x_n) \end{equation}\]



\[\begin{equation} \tag{17.17} \text{Máximo} = \max(x_1, x_2, \ldots, x_n) \end{equation}\]


Regressão linear com valores extremos.

Figura 17.16: Regressão linear com valores extremos.


17.12 Erro


17.12.1 Que parâmetros de erro podem ser estimados?


\[\begin{equation} \tag{17.18} ME = z_{\alpha/2} \cdot \frac{\sigma}{\sqrt{n}} \end{equation}\]


  • Erro-padrão da média (EPM) (17.19) (\(sigma\) conhecido) e (17.20) (\(sigma\) desconhecido).204,208


\[\begin{equation} \tag{17.19} EPM = \frac{\sigma}{\sqrt{n}} \end{equation}\]


\[\begin{equation} \tag{17.20} \widehat{EPM} = \frac{s}{\sqrt{n}} \end{equation}\]


17.13 Distribuição


17.13.1 Que parâmetros de distribuição podem ser estimados?


\[\begin{equation} \tag{17.21} \gamma_1 = \frac{\frac{1}{n}\sum_{i=1}^{n}(x_i - \bar{x})^3}{\left(\frac{1}{n}\sum_{i=1}^{n}(x_i - \bar{x})^2\right)^{3/2}} \end{equation}\]



\[\begin{equation} \tag{17.22} \gamma_2 = \frac{\frac{1}{n}\sum_{i=1}^{n}(x_i - \bar{x})^4}{\left(\frac{1}{n}\sum_{i=1}^{n}(x_i - \bar{x})^2\right)^{2}} \end{equation}\]



\[\begin{equation} \tag{17.23} \kappa = \gamma_2 - 3 \end{equation}\]


Parâmetros de distribuição: Assimetria e Curtose.

Figura 17.17: Parâmetros de distribuição: Assimetria e Curtose.


Parâmetros de distribuição: Curtose em distribuições simétricas (normal vs. uniforme).

Figura 17.18: Parâmetros de distribuição: Curtose em distribuições simétricas (normal vs. uniforme).


17.14 Parâmetros robustos


17.14.1 O que são parâmetros robustos?

  • Parâmetros robustos são medidas de posição e dispersão que permanecem estáveis mesmo na presença de valores discrepantes.211


17.14.2 Por que utilizar parâmetros robustos?

  • Parâmetros robustos garantem maior confiabilidade quando os dados não seguem a normalidade ou apresentam contaminação por outliers.211

  • Parâmetros robustos permitem análises mais estáveis em estudos exploratórios, evitando decisões equivocadas sobre variabilidade ou tendência central.211


17.14.3 O que é ponto de quebra?

  • É a menor proporção de contaminação que pode levar o estimador a resultados arbitrariamente errados; quanto maior, mais robusto.212


17.14.4 Que parâmetros robustos podem ser estimados?

  • Média e variância Winsorizadas como opções intermediárias, reduzindo a influência dos outliers.211

  • Mediana, com \(~50%\) de ponto de quebra e função influência limitada.211,212

  • Median Absolute Deviation (MAD) (17.24), com correção 1,483 para normalidade, com \(~50%\) de ponto de quebra.211,212


\[\begin{equation} \tag{17.24} MAD = 1.483 \cdot \text{median}(|x_i - \text{median}(x)|) \end{equation}\]


  • Primeiro quartil das diferenças pareadas (\(Qn\)) (17.25), com \(~50%\) de ponto de quebra.211,212


\[\begin{equation} \tag{17.25} Qn = 2.2219 \cdot \text{first quartile}(|x_i - x_j|; i < j) \end{equation}\]


  • O intervalo interquartil (\(IQR\)) (17.11) é robusto, com ponto de quebra \(~25%\), sendo simples de interpretar e útil em boxplots.212



Citar como:
Ferreira, Arthur de Sá. Ciência com R: Perguntas e respostas para pesquisadores e analistas de dados. Rio de Janeiro: 1a edição,


Referências

31.
R Core Team. R: A Language and Environment for Statistical Computing. Vienna, Austria: R Foundation for Statistical Computing; 2023. https://www.R-project.org/.
135.
Altman DG, Bland JM. Statistics notes Variables and parameters. BMJ. 1999;318(7199):1667–1667. doi:10.1136/bmj.318.7199.1667
136.
Vetter TR. Fundamentals of Research Data and Variables. Anesthesia & Analgesia. 2017;125(4):1375–1380. doi:10.1213/ane.0000000000002370
137.
Ali Z, Bhaskar Sb. Basic statistical tools in research and data analysis. Indian Journal of Anaesthesia. 2016;60(9):662. doi:10.4103/0019-5049.190623
159.
R Core Team. R: A Language and Environment for Statistical Computing.; 2025. https://www.R-project.org/.
193.
WILD C. THE CONCEPT OF DISTRIBUTION. STATISTICS EDUCATION RESEARCH JOURNAL. 2006;5(2):10–26. doi:10.52041/serj.v5i2.497
194.
S M. Frequency distribution. Journal of Pharmacology and Pharmacotherapeutics. 2011;2(1):54–56. doi:10.4103/0976-500x.77120
195.
Sturges HA. The Choice of a Class Interval. Journal of the American Statistical Association. 1926;21(153):65–66. doi:10.1080/01621459.1926.10502161
196.
SCOTT DW. On optimal and data-based histograms. Biometrika. 1979;66(3):605–610. doi:10.1093/biomet/66.3.605
197.
Freedman D, Diaconis P. On the histogram as a density estimator:L 2 theory. Zeitschrift für Wahrscheinlichkeitstheorie und Verwandte Gebiete. 1981;57(4):453–476. doi:10.1007/bf01025868
198.
R Core Team. R: A Language and Environment for Statistical Computing.; 2023. https://www.R-project.org/.
199.
Wickham H. ggplot2: Elegant Graphics for Data Analysis. Springer; 2016. https://ggplot2.tidyverse.org.
200.
Kay M. ggdist: Visualizations of Distributions and Uncertainty in the Grammar of Graphics. IEEE Transactions on Visualization and Computer Graphics. 2024;30(1):414–424. doi:10.1109/TVCG.2023.3327195
201.
Tang Y, Horikoshi M, Li W. ggfortify: Unified Interface to Visualize Statistical Result of Popular R Packages. V 8.; 2016. doi:10.32614/RJ-2016-060
202.
Darling HS. Do you have a standard way of interpreting the standard deviation? A narrative review. Cancer Research, Statistics, and Treatment. 2022;5(4):728–733. doi:10.4103/crst.crst_284_22
203.
Kanji G. 100 Statistical Tests. SAGE Publications Ltd; 2006. doi:10.4135/9781849208499
204.
Curran-Everett D. Explorations in statistics: standard deviations and standard errors. Advances in Physiology Education. 2008;32(3):203–208. doi:10.1152/advan.90123.2008
205.
Altman DG, Bland JM. Statistics Notes: Quartiles, quintiles, centiles, and other quantiles. BMJ. 1994;309(6960):996–996. doi:10.1136/bmj.309.6960.996
206.
S. M. Measures of central tendency: The mean. Journal of Pharmacology and Pharmacotherapeutics. 2011;2(2):140–142. doi:10.4103/0976-500x.81920
207.
S. M. Measures of central tendency: Median and mode. Journal of Pharmacology and Pharmacotherapeutics. 2011;2(3):214–215. doi:10.4103/0976-500x.83300
208.
Krzywinski M, Altman N. Error bars. Nature Methods. 2013;10(10):921–922. doi:10.1038/nmeth.2659
209.
Manikandan S. Measures of dispersion. Journal of Pharmacology and Pharmacotherapeutics. 2011;2(4):315–316. doi:10.4103/0976-500x.85931
210.
Sahai H, Misra S. Definitions of Sample Variance: Some Teaching Problems to be Overcome. The Statistician. 1992;41(1):55. doi:10.2307/2348636
211.
Daszykowski M, Kaczmarek K, Vander Heyden Y, Walczak B. Robust statistics in data analysis A review. Chemometrics and Intelligent Laboratory Systems. 2007;85(2):203–219. doi:10.1016/j.chemolab.2006.06.016
212.
Rousseeuw PJ, Hubert M. Robust statistics for outlier detection. WIREs Data Mining and Knowledge Discovery. 2011;1(1):73–79. doi:10.1002/widm.2