Orice set de date acumulate în scopuri statistice, cum ar fi datele recensământului Statelor Unite, conțin informații care necesită însumare și agregare. Este aproape imposibil să enumerăm atributele, de exemplu, ca venituri individuale și dimensiuni familiale. Statisticienii folosesc grafice de distribuție a frecvențelor pentru a descrie datele într-o manieră cuprinzătoare. De exemplu, o histogramă împarte datele în intervale de clasă și numără frecvența la care apar toți membrii care aparțin acelui interval de clasă.Deși nu există reguli stricte cu privire la modul de calcul al mărimii și numărului de intervale de clasă, există câteva criterii convenționale utile.
Calculați intervalul de date, adică diferența dintre cele mai mari și cele mai mici puncte de date. De exemplu, presupunem că cel mai bine plătit individ din SUA câștigă 30 de miliarde de dolari pe an, iar cel mai mic câștigă zero. Intervalul este egal cu 30 - 0, ceea ce este egal cu 30 de miliarde de dolari.
Determinați numărul de clase în funcție de dimensiunea eșantionului. De regulă, cinci până la șapte clase sunt utilizate pentru mărimea eșantionului până la 50, opt până la 10 clase pentru mărimea eșantionului între 50 și 100, 10-15 clase pentru mărimea eșantionului între 100 și 250 și 15-20 clase pentru mărimea eșantionului mai mare de 250.
Calculați intervalul de clasă utilizând următoarea formulă: Interval de clasă = interval ÷ numărul de clase. Dacă aveți 15 clase de venit în exemplul de distribuire a venitului, calculați 30 ÷ 15 = 2 miliarde de dolari. Adesea, statisticienii ignoră cifrele extrem de înalte și mici și se concentrează pe frecvențele medii. Din acest motiv, distribuția veniturilor în S.U.A. este prezentată la intervale mai mici de 10.000 USD cu venituri mai mari decât o anumită cifră, de obicei un milion, împărțite într-un singur interval de clasă.
Folosiți-vă discreția când calculați intervalul de clasă. Graalul sfânt al unui grafic precum o histogramă este de a transmite informații relevante într-un mod semnificativ și simplu. Alegeți-vă intervalele de clasă pentru a transmite informațiile pe care le considerați demne de a le atrage cititorilor.