Een histogram is een grafische weergave van gegevens voor het eerst geïntroduceerd door statisticus Karl Pearson. Een histogram bestaat uit een aantal rechthoeken of "opslaglocaties," waar de hoogte van de rechthoek geeft de frequentie van de waarnemingen, en de breedte van de rechthoek geeft de hoeveelheid wordt gemeten. De oppervlakte van de rechthoek voorstelt dus het totale aantal opmerkingen. Het histogram is ingesteld als een grafiek, met nummers op de horizontale as gerangschikt in volgorde zodat de relatieve frequentie waarmee gebeurtenissen kan worden vergeleken. Er geldt geen exacte aantal opslaglocaties voor een histogram, maar er zijn algemene regels die kunnen worden gevolgd om u te helpen bij de ontwikkeling van een histogram.
Bepalen hoe breed u wenst de opslaglocatie te zijn. Bijvoorbeeld, veronderstel dat u graag elke opslaglocatie voor twee opeenvolgende waarden op de horizontale as (zeg 1 en 2, of 5 en 6); Daarom is de breedte bin 2.
Aftrekken van de maximumwaarde in de gegevensverzameling door de minimumwaarde in de gegevensset. Bijvoorbeeld, als de maximale observatie 24 is en de minimumwaarde nul is, is de daaruit voortvloeiende verschil 24.
Deelt het verschil van de maximale en minimale waarden door de breedte van de opslaglocaties. Voor het voorbeeld hier, zou dit betekenen 24 delen door 2, waardoor 12. Dit is het aantal opslaglocaties dat moet worden gebruikt voor uw histogram.
- Als het optimale aantal berekende opslaglocaties een decimaal getal is, ronde dit aantal tot het dichtstbijzijnde gehele getal, ongeacht de waarde. Bijvoorbeeld, als de optimale bin-nummer is berekend als 4.15, dit zou afgerond tot 5.
- Een breed scala aan technieken kan worden gebruikt voor het bepalen van de optimale bin grootte en aantal. De hier beschreven methode is het meest in het algemeen van toepassing is; de specifieke techniek die wordt gebruikt kan echter afhankelijk van de specifieke toepassing van het histogram.