|
A primeira premissa diz respeito aos valores das despesas: assume-se, por hipótese, que os dados de cada classe estejam uniformemente distribuídos ao longo dos intervalos, o que significa dizer que, supostamente, os 350 clientes do primeiro intervalo estariam distribuídos de forma "equilibrada" entre os diversos valores entre 10 e 20 reais, o mesmo valendo para os 725 do segundo intervalo e assim sucessivamente. Sendo assim, a despesa média para cada intervalo passa a ser o próprio ponto médio do respectivo intervalo, sendo este o ponto que mais se aproximaria (provocaria menor erro) do conjunto das despesas inseridas em cada intervalo. É claro que a questão da largura do intervalo passa a ter uma expressiva relevância, pois quanto maior sua amplitude, maior nossa "ignorância" a respeito dos dados ali inseridos e, conseqüentemente, menor a precisão das medidas que se pretende calcular. À medida que a largura dos intervalos aumenta, se por um lado a precisão diminui, a síntese/o resumo na apresentação dos dados aumenta. E, como não é possível dissociar um fato do outro, o que se busca é um equilíbrio entre perda/ganho de precisão e ganho/perda de síntese. Não há uma formulação "mágica" que assegure configurações ótimas neste sentido (embora alguns textos apresentem fórmulas, como a de Sturges, que buscam este objetivo, ao estabelecer um número de classes a partir de uma estrutura que utiliza a função logarítmica e o total de indivíduos/objetos estudados). Recomenda-se bom senso, tendo-se em mente que um bom sinalizador de que o equilíbrio ainda não foi alcançado é quando uma (ou mais classes) apresentam freqüências julgadas muito superiores ou muito inferiores à maioria das demais. |
Copyright
© 2003 AIEC..
|