Een van de meest fundamentele concepten in statistieken is de gemiddelde of rekenkundig gemiddelde, een aantal nummers. Het gemiddelde betekent een centrale waarde voor de gegevensset. De variantie van een gegevensset maatregelen hoe ver de elementen van die set gegevens zijn verspreid ten opzichte van het gemiddelde. Gegevenssets waarin de nummers allemaal dicht bij het gemiddelde zijn zal hebben een lage variantie. Die verzamelingen waarin de nummers zijn veel hoger of lager dan het gemiddelde een hoge variantie hebben zal.
Berekent gemiddelde van de gegevensset
Aangezien de variantie de hoeveelheid scheiding ten opzichte van de gemiddelde meet, is de eerste stap bij het vinden van de variantie van een gegevensset te vinden van het gemiddelde. Bijvoorbeeld, berekent een winkel de dagelijkse inkomsten gedurende zeven dagen:
Dag 1: $62.000
Dag 2: $64,800
Dag 3: $62,600
Dag 4: $69,200
Dag 5: $66,000
Dag 6: $63,900
Dag 7: $69,400
Het gemiddelde voor de dagelijkse inkomsten van de winkel voor de week is:
(62000 + 64800 + 62600 + 69200 + 66000 + 63900 + 69400) / 7 = 457900/7 = $65,414.29
Berekenen van de gekwadrateerde verschillen
De volgende stap impliceert het verschil tussen elk element in de gegevensset en het gemiddelde te berekenen. Aangezien sommige elementen hoger zijn dan het gemiddelde zullen en sommige zullen lager zijn, de variantie berekening is gebaseerd op het plein van de verschillen.
De verkoop van de dag 1 - gemiddelde verkoop: $62.000 - $65414.29 = (-$3,414.29); (-3,414.29) 2 = 11,657,346.94
De verkoop van de dag 2 - gemiddelde verkoop: $64,800 - $65414.29 = (-$614.29); (-614.29) 2 = 377,346.94
De verkoop van de dag 3 - gemiddelde verkoop: $62,600 - $65414.29 = (-$2,814.29); (-2,814.29) 2 = 7,920,204.08
Dag 4 verkoop - gemiddelde verkoop: $69,200 - $65414.29 = (+ $3,785.71); (+3,785.71) 2 = 14,331,632.65
Dag 5 verkoop - gemiddelde verkoop: $66,000 - $65414.29 = (+ $585.71); (+585.71) 2 = 343,061.22
De verkoop van de dag 6 - gemiddelde verkoop: $63,900 - $65414.29 = (-$1,514.29); (-1,514.29) 2 = 2,293,061.22
Dag 7 verkoop - gemiddelde verkoop: $69,400 - $65414.29 = (+ $3,985.71); (+3,985.71) 2 = 15,885,918.37
Opmerking: de gekwadrateerde verschillen worden niet gemeten in dollars. Deze nummers worden gebruikt in de volgende stap om de variantie te berekenen.
Variantie en standaarddeviatie
De variantie wordt gedefinieerd als het gemiddelde van de gekwadrateerde verschillen.
11,657,346.94 + 377,346.94 + 7,920,204.08 + 14,331,632.65 + 343,061.22 + 2,293,061.22 + 15,885,918.37 = 52,808,571.43
52,808,571.43/7 = 7,544,081.63
Aangezien de variantie gebruikmaakt van het kwadraat van het verschil, zal de vierkantswortel van de variantie een duidelijker aanwijzing voor de werkelijke spreiding geven. In de statistiek, de vierkantswortel van de variantie heet de standaarddeviatie.
SQRT(7,544,081.63) = $2,746.65
Toepassingen voor variantie en standaarddeviatie
Zowel variantie en standaarddeviatie zijn zeer nuttig in de statistische analyse. De variantie meet de totale verspreiding van een gegevensset van het gemiddelde. De standaarddeviatie helpt bij de opsporing van uitschieters, of elementen van de gegevens instellen dat verdwaalde te ver van het gemiddelde.
In de bovenstaande gegevensverzameling is de variantie vrij hoog, met slechts twee dagelijkse verkooptotalen komt naar binnen 1.000 dollar van het gemiddelde. De gegevensset toont ook aan dat twee van de zeven dagelijkse verkooptotalen meer dan één standaarddeviatie boven het gemiddelde, zijn terwijl de twee anderen zijn meer dan één standaarddeviatie onder het gemiddelde.