4 - Divisão da Base de Dados: Decis e Percentis

Em uma base de dados considerada suficientemente grande, à medida que a heterogeneidade aumenta, pode ser necessário dividi-la em mais de quatro grupos (o que é possível com utilização dos três quartis e dos valores mínimo e máximo do grupo), pois o recurso de gerar grupos menores em muito contribui para melhor visualização da distribuição do conjunto de dados, uma vez que esses subgrupos, em geral, quanto menores, mais homogêneos.

A exemplo dos quartis, também são clássicos os decis e os percentis, que, como seus próprios nomes sinalizam, dividem a base de dados em dez e em cem subgrupos, respectivamente. Os três quartis nada mais são do que o 25º, 50º e 75º percentis. Os nove decis também são percentis, correspondendo ao 10º, 20º, 30º, 40º, 50º, 60º, 70º, 80º e 90º percentis.

Decil

Percentil

O procedimento para determinação dessas medidas não tem nada de excepcional, sendo análogo àquele adotado para os quartis (que, como dito no parágrafo anterior, são percentis).

O conjunto completo desses valores que dividem/separam a base de dados forma o que se chama conjunto de separatrizes.



Copyright © 2012 AIEC..