Guia online do Usuário v4.0 até v4.24 do DivEs - Diversidade de Espécies

Atenção: Versão atual do software 4.24.99.2404


Tópicos

Teste de Kolmogorov-Smirnov: v.4.3

Em estatística, o teste Kolmogorov–Smirnov (também conhecido como teste KS ou teste K–S) é um teste não paramétrico sobre a igualdade de distribuições de probabilidade contínuas e unidimensionais que pode ser usado para comparar uma amostra com uma distribuição de probabilidade de referência (teste K–S uniamostral) ou duas amostras uma com a outra (teste K–S biamostral). Recebe este nome em homenagem aos matemáticos russos Andrei Kolmogorov e Nikolai Smirnov.

A estatística de Kolmogorov–Smirnov quantifica a distância entre a função distribuição empírica da amostra e a função distribuição acumulada da distribuição de referência ou entre as funções distribuição empírica de duas amostras. A distribuição nula desta estatística é calculada sob a hipótese nula de que a amostra é retirada da distribuição de referência (no caso uniamostral) ou de que as amostras são retiradas da mesma distribuição (no caso biamostral). Em cada caso, as distribuições consideradas sob a hipótese nula são distribuições contínuas, mas não restritas.

O teste K–S biamostral é um dos métodos não paramétricos mais úteis e difundidos para a comparação de duas amostras, já que é sensível a diferenças tanto no local, como na forma das funções distribuição acumulada empírica das duas amostras.

O teste de Kolmogorov–Smirnov pode ser modificado para servir como um teste da qualidade do ajuste. No caso especial do teste da normalidade da distribuição, as amostras são padronizadas e comparadas com uma distribuição normal padrão. Isto equivale a tornar a média e a variância da distribuição de referência iguais aos estimados da amostras, sabendo que usar isto para definir a distribuição de referência específica muda a distribuição nula da estatística. Vários estudos encontraram que, mesmo nesta forma corrigida, o teste é menos potente em avaliar a normalidade do que o teste de Shapiro–Wilk e o teste de Anderson–Darling. Entretanto, estes outros testes também têm suas desvantagens. O teste de Shapiro–Wilk, por exemplo, é conhecido por não funcionar bem em amostras com muitos valores idênticos.

O teste de Kolmogorov - Smirnov pode ser utilizado para avaliar as hipóteses:

\left \{ \begin{matrix} H_0: & \mbox{Os dados seguem uma distribui\c{c}\~ao normal}\\\\ H_1: & \mbox{Os dados n\~ao seguem uma distribui\c{c}\~ao normal} \end{matrix} \right.

Este teste observa a máxima diferença absoluta entre a função de distribuição acumulada assumida para os dados, no caso a Normal, e a função de distribuição empírica dos dados. Como critério, comparamos esta diferença com um valor crítico, para um dado nível de significância.

Considere uma amostra aleatória simples X_1, X_2 , \cdots , X_nde uma população com função de distribuição acumulada contínua F_X desconhecida. A estatística utilizada para o teste é:

\[D_n=\sup_x|F(x)-F_n(x)|\]

Esta função corresponde a distância máxima vertical entre os gráficos de F(x) e F_n(x) sobre a amplitude dos possíveis valores de x. Em D_n temos que

  • F(x) representa a função de distribuição acumulada assumida para os dados;
  • F_n(x) representa a função de distribuição acumulada empírica dos dados.

Neste caso, queremos testar a hipótese F_X = F contra a hipótese alternativa F_X \neq F. Para isto, tomamos X_{(1)}, X_{(2)}, \cdots , X_{(n)} as observações aleatórias ordenadas de forma crescente da população com função de distribuição contínua F_X. No caso de análise da normalidade dos dados, assumimos F a função de distribuição da normal.

A função de distribuição acumulada assumida para os dados é definida por F(x_{(i)}) = \mathbb{P}(X\leq x_{(i)}) e a função de distribuição acumulada empírica é definida por uma função escada, dada pela fórmula:

F_n(x)=\frac{1}{n}\sum_{i=1}^n I_{\{(-\infty,x]\}}(x_{(i)})

onde I_A é a função indicadora. A função indicadora é definida da seguinte forma:

I_{A}=\left\{\begin{array}{l} 1; \ \hbox{se} \ x\in A \ 0; \ \hbox{caso contr\'ario}\end{array}\right.

Sob H_0, a distribuição assintótica da estatística de kolmogorov-Smirnov é dada por:

\[\lim_{n \rightarrow \infty}P\left[\sqrt{n} D_n \leq x\right] = 1-2 \sum_{j=1}^{\infty} (-1)^{j-1} exp^{-2j^2x^2}.\]

Fontes:

Teste Kolmogorov-Smirnov - Origem: Wikipédia, a enciclopédia livre

PortalAction - Testes de normalidade - Teste de Kolmogorov-Smirnov


Como citar este texto:

Rodrigues, W.C., 2024. Teste de Kolmogorov-Smirnov. DivEs - Diversidade de Espécies v.4.24.99.2404 (AntSoft Systems On Demand) - Guia do Usuário. Disponível em: <https://dives.antsoft.com.br>. Acesso em: 21/11/2024


Texto criado em: 18/08/2018 - Atualizado em: 18/08/2018

Versão do guia Online: 3.0.9.2401 - Atualizado em: 09/01/2024