Transformação de dados: v.4.2
Razões para a transformação dos dados.
Quando algum dos requisitos para o emprego da estatística paramétrica - normalidade da distribuição dos erros, homogeneidade das variâncias, e aditividade dos efeitos dos fatores de variação - não puder ser preenchido pelos dados da sua amostra experimental, o pesquisador pode ainda tentar o recurso da transformação dos dados, antes de optar pela aplicação da estatística não-paramétrica. É um recurso que sempre vale a pena tentar, porque a estatística paramétrica é evidentemente mais poderosa que a não-paramétrica. De fato, esta somente foi desenvolvida como um recurso complementar, destinado a suprir a necessidade de testes estatísticos nos casos em que alguma restrição desaconselhava o uso da estatística paramétrica, ou quando a própria natureza dos dados, muitas vezes não exatamente numéricos, vedava a aplicação desta.[1]
As transformações mais comumente utilizadas.
As transformações diretas dos dados mais comumente utilizadas são: a logarítmica, a logarítmica dos (dados+1), a raíz quadrada dos dados , a raíz quadrada dos (dados + 1, ou mais 1/2), a raíz cúbica dos dados, a transformação angular, a transformação hiperbólica de primeiro grau (ou o inverso dos dados) ou hiperbólica de segundo grau, a transformação percentual, e a transformação em valores de z, já referida quando se comentaram os testes para verificar a normalidade da distribuição dos erros amostrais.[1]
Transformações[2]
Raiz Quadrada
Essa transformação é utilizada quando a variância é proporcional a média, ou seja, quando há uma redução dos valores de média e variância diminui simultaneamente.
É frequentemente utilizado em dados biológicos quando amostras são tiradas da Distribuição de Poisson (isto é, quando os dados consistem em ocorrências aleatórias de tempo ou região ou espaço).
Transformando os dados utilizando suas raízes quadradas resulta em uma amostra cuja distribuição é normal.
Os dados que se recomenda utilizar este tipo de transformação são dados de percentagens e contagens (variáveis numéricas discretas).
As equações normalmente utilizadas são:
x'=\sqrt{x+0,5} ou x'=\sqrt{x+1} ou x'=\sqrt{x}
Sendo a primeira mais utilizada.
É sempre preferível usar x'=\sqrt{x+0,5} ou ainda usar x'=\sqrt{x+1} por uma razão bem simples, quando o valor de x=0 ele se aproxima da média dos valores transformados, ou seja, será 0,7071 e 1 respectivamente.
x'=\sqrt{x} é preferencialmente utilizada em conjunto de dados pequenos.
Admite-se ainda a transformação usando:
x'=\sqrt{x}+\sqrt{x+1}
x'=\sqrt{x+3 \over 8}
Transformação Logarítmica
Este transformação é utilizada principalmente quando as médias e os desvios padrões (erros) tendem a serem proporcionais, sendo, nesse caso, os coeficientes de variação aproximadamente iguais.
É utilizada, ainda, quando os dados são representados por números positivos, ou porcentagens que abrangem uma grande amplitude de variação.
Quando aparece o valor zero, utiliza-se a transformação x' = \log{x+1}.
A base 10 para os logaritmos é utilizada normalmente, por conveniência, porém qualquer outra base poderá ser utilizada, desde que, seja especificada.
Transformação Angular (Arcoseno)
Essa transformação é utilizada quando os dados estão associados a uma distribuição binomial (presença-ausência), como muitas vezes que um determinado caráter aparece num total definido.
É o caso, por exemplo, do número de plantas sobreviventes em relação ao número total de plantas que deveriam estar presentes se nenhuma tivesse morrido após ataque severo de algum inseto.
Os dados são transformados em percentagens e, em seguida, são calculados os valores através da fórmula p'=\arcsin(\sqrt{p}), utilizando-se uma tabela apropriada.
Nesse tipo de transformação, todos os dados deveriam estar baseados em um número de observações iguais, mas o método pode também ser utilizado quando esse número não é rigorosamente igual é sugerido na literatura que valores de 0 e 100%, sejam substituídos por \frac{1}{4}n e 100 -\frac{1}{4}n, respectivamente, antes de entrar na tabela.
É possível ainda voltar os dados ao original utilizando a função seno:
p=\left (\sin {p'}\right)^2
Referências:
1. Geraldo Maia Campos, 2000. Estatística Prática para Docentes e Pós-Graduandos
2. Rodrigues, William Costa, 2016. Transformação de Dados. Estatística na Mão. Disponível em: http://estatisticanamao.agroamb.com.br/estatisticanamao/artigos.aspx?ID=2. [Acesso em: 19.08.2018].
Como citar este texto:
Rodrigues, W.C., 2024. Transformação de dados. DivEs - Diversidade de Espécies v.4.24.99.2404 (AntSoft Systems On Demand) - Guia do Usuário. Disponível em: <https://dives.antsoft.com.br>. Acesso em: 03/12/2024
Texto criado em: 19/08/2018 - Atualizado em: 19/08/2018
Versão do guia Online: 3.0.9.2401 - Atualizado em: 09/01/2024