|
Uma abordagem também válida para diagnóstico de pontos discrepantes/outliers é encará-los como pontos que estejam muito além ou muito aquém do terceiro quartil e do primeiro quartil, respectivamente. Mas o que seriam estes muito além e muito aquém? Alguns autores propõem que seja calculada uma medida de dispersão alternativa ao desvio-padrão dada pelo intervalo interquartil (ou interquartílico), que é a diferença entre o terceiro e primeiro quartis. A partir daí, multiplica-se esta diferença por 3/2 e o resultado é somado ao terceiro quartil e subtraído do primeiro quartil, ficando determinado o intervalo de "tolerância" para dados considerados típicos. Observações fora deste intervalo são pontos discrepantes. A justificativa pela escolha do multiplicador 3/2 é conseqüência de algumas características particulares de uma distribuição de dados adotada em muitos estudos, denominada distribuição normal segundo a qual menos de 1% dos dados seriam passíveis de inclusão na categoria de discrepantes. |
Copyright
© 2003 AIEC..
|