Een Z-score is een statistische berekening die u kunt uitvoeren op één gegevenspunt dat tot de grotere gegevensset behoort. De Z-score vertelt u hoever--in standaarddeviaties--dat gegevenspunt afkomstig van de gemiddelde, of de gemiddelde, van de gegevensset is.
De score kunnen nuttig zijn bij het voorspellen van de kans dat de nieuwe gegevens op, boven of onder het punt waarvoor u de score berekend zal worden. Z scores hebben toepassingen in het bedrijfsleven, de wetenschappen, en in zowat elke andere discipline betekent dat data-analyse.
De gegevensset
Als u zich indenkt dat Mr. Smith's gym klasse 20 studenten waarvan lopende capaciteiten een representatieve steekproef van de hele school zijn. Vandaag, in Mr. Smith's klasse liep de studenten een 200-meter-dash. De studenten afwerking tijden vormen een normaalverdeling-- of belcurve--met een gemiddelde score van 75 seconden een standaardafwijking van 10 seconden. De gegevens hieronder toont hun afwerking tijden:
{80, 76, 83, 77, 81, 97, 64, 83, 69, 63, 60, 53, 76, 98, 67, 75, 89, 74, 59, 91}
De vraag
Nu, stel je dat Mr. Smith wil weten van de waarschijnlijkheid dat een willekeurig student geselecteerd uit de rest van de schoolbevolking het streepje in 90 seconden of minder afmaken kon. Berekening van de Z-score op die nieuwe gegevens is punt--90 seconden--de eerste stap bij het uitzoeken van de kans.
Berekening van de Z-Score
De formule voor de berekening van een Z-score worden de betrokken gegevenspunt, het gemiddelde van de gegevensverzameling en de standaarddeviatie van de gegevensset. In de vergelijking voor de Z-score hieronder, x staat voor het gegevenspunt, m staat voor het gemiddelde van de gegevensset en sd staat voor de standaarddeviatie van de gegevensset.
Z = (x - m) / sd
Het gemiddelde van de studenten lopen tijden is 75 seconden, de standaarddeviatie is 10 seconden en het gegevenspunt in kwestie is 90 seconden. De berekening van de Z-score voor deze gegevenspunt ziet er zo uit:
Z = (90 seconden - 75 seconden) / 10 seconden = 1,50
Het vinden van de waarschijnlijkheid
De Z-score voor een eindtijd van 90 seconden op basis van Mr. Smith's gegevensset is 1,50. Dit betekent dat een tijd van 90 seconden 1,50 standaarddeviaties boven het gemiddelde is--een negatieve Z-score geeft aan dat het nieuwe gegevenspunt is lager dan het gemiddelde.
Om erachter te komen de kans op een nieuwe gegevenspunt vallen op of onder 90 seconden, moet u een Z distributie tabel, zoals de grafiek van de Columbia University Business Schoolraadplegen.
Lokaliseren van de score van 1,5 in de eerste kolom en het vergelijken met de nul in de eerste rij, omdat nul het volgende cijfer na de 5 in de Z-score is, blijkt een kans van 0.9332.
U kunt interpreteren dit antwoord om te betekenen dat een student die willekeurig gekozen uit de rest van de school heeft een 93.32 procent kans afwerking van de 200-meter-dash in 90 seconden of minder. Mr. Smith de vraag heeft beantwoord!
Een stap verder
Wat als Mr. Smith wilde weten van de waarschijnlijkheid dat een willekeurig geselecteerde student langer dan 90 seconden duren zou tot het einde van de dash. Voor postuur zulks uiterlijk, aftrekken simpelweg de kans voor de 90 tweede Z score 1, zoals hieronder getoond.
1 - 0.9332 = 0.0668
Er is een 6,68 procent kans dat het een willekeurig geselecteerde student langer dan 90 seconden duren zou tot het einde van het dashboard.