Teste de Kolmogorov-Smirnov: v.4.3
Em estatística, o teste Kolmogorov–Smirnov (também conhecido como teste KS ou teste K–S) é um teste não paramétrico sobre a igualdade de distribuições de probabilidade contínuas e unidimensionais que pode ser usado para comparar uma amostra com uma distribuição de probabilidade de referência (teste K–S uniamostral) ou duas amostras uma com a outra (teste K–S biamostral). Recebe este nome em homenagem aos matemáticos russos Andrei Kolmogorov e Nikolai Smirnov.
A estatística de Kolmogorov–Smirnov quantifica a distância entre a função distribuição empírica da amostra e a função distribuição acumulada da distribuição de referência ou entre as funções distribuição empírica de duas amostras. A distribuição nula desta estatística é calculada sob a hipótese nula de que a amostra é retirada da distribuição de referência (no caso uniamostral) ou de que as amostras são retiradas da mesma distribuição (no caso biamostral). Em cada caso, as distribuições consideradas sob a hipótese nula são distribuições contínuas, mas não restritas.
O teste K–S biamostral é um dos métodos não paramétricos mais úteis e difundidos para a comparação de duas amostras, já que é sensível a diferenças tanto no local, como na forma das funções distribuição acumulada empírica das duas amostras.
O teste de Kolmogorov–Smirnov pode ser modificado para servir como um teste da qualidade do ajuste. No caso especial do teste da normalidade da distribuição, as amostras são padronizadas e comparadas com uma distribuição normal padrão. Isto equivale a tornar a média e a variância da distribuição de referência iguais aos estimados da amostras, sabendo que usar isto para definir a distribuição de referência específica muda a distribuição nula da estatística. Vários estudos encontraram que, mesmo nesta forma corrigida, o teste é menos potente em avaliar a normalidade do que o teste de Shapiro–Wilk e o teste de Anderson–Darling. Entretanto, estes outros testes também têm suas desvantagens. O teste de Shapiro–Wilk, por exemplo, é conhecido por não funcionar bem em amostras com muitos valores idênticos.
O teste de Kolmogorov - Smirnov pode ser utilizado para avaliar as hipóteses:
\left \{ \begin{matrix}
H_0: & \mbox{Os dados seguem uma distribui\c{c}\~ao normal}\\\\
H_1: & \mbox{Os dados n\~ao seguem uma distribui\c{c}\~ao normal}
\end{matrix} \right.
Este teste observa a máxima diferença absoluta entre a função de distribuição acumulada assumida para os dados, no caso a Normal, e a função de distribuição empírica dos dados. Como critério, comparamos esta diferença com um valor crítico, para um dado nível de significância.
Considere uma amostra aleatória simples X_1, X_2 , \cdots , X_nde uma população com função de distribuição acumulada contínua F_X desconhecida. A estatística utilizada para o teste é:
\[D_n=\sup_x|F(x)-F_n(x)|\]
Esta função corresponde a distância máxima vertical entre os gráficos de F(x) e F_n(x) sobre a amplitude dos possíveis valores de x. Em D_n temos que
- F(x) representa a função de distribuição acumulada assumida para os dados;
- F_n(x) representa a função de distribuição acumulada empírica dos dados.
Neste caso, queremos testar a hipótese F_X = F contra a hipótese alternativa F_X \neq F. Para isto, tomamos X_{(1)}, X_{(2)}, \cdots , X_{(n)} as observações aleatórias ordenadas de forma crescente da população com função de distribuição contínua F_X. No caso de análise da normalidade dos dados, assumimos F a função de distribuição da normal.
A função de distribuição acumulada assumida para os dados é definida por F(x_{(i)}) = \mathbb{P}(X\leq x_{(i)}) e a função de distribuição acumulada empírica é definida por uma função escada, dada pela fórmula:
F_n(x)=\frac{1}{n}\sum_{i=1}^n I_{\{(-\infty,x]\}}(x_{(i)})
onde I_A é a função indicadora. A função indicadora é definida da seguinte forma:
I_{A}=\left\{\begin{array}{l} 1; \ \hbox{se} \ x\in A \ 0; \ \hbox{caso contr\'ario}\end{array}\right.
Sob H_0, a distribuição assintótica da estatística de kolmogorov-Smirnov é dada por:
\[\lim_{n \rightarrow \infty}P\left[\sqrt{n} D_n \leq x\right] = 1-2 \sum_{j=1}^{\infty} (-1)^{j-1} exp^{-2j^2x^2}.\]
Fontes:
Teste Kolmogorov-Smirnov - Origem: Wikipédia, a enciclopédia livre
PortalAction - Testes de normalidade - Teste de Kolmogorov-Smirnov
Como citar este texto:
Rodrigues, W.C., 2024. Teste de Kolmogorov-Smirnov. DivEs - Diversidade de Espécies v.4.24.99.2404 (AntSoft Systems On Demand) - Guia do Usuário. Disponível em: <https://dives.antsoft.com.br>. Acesso em: 21/11/2024
Texto criado em: 18/08/2018 - Atualizado em: 18/08/2018
Versão do guia Online: 3.0.9.2401 - Atualizado em: 09/01/2024