Thema 4 · Discrete kansvariabelen

Deel 2 — Standaardiseren · het gewogen gemiddelde

Een dobbelspel in het bos

De kraai heeft een gokspel opgezet. Je gooit met een dobbelsteen, en hij heeft ’m stiekem onzuiver gemaakt: de lage ogen vallen vaker dan de hoge. De kansen liggen dus vast — en als de kansen vastliggen, kunnen we van tevoren uitrekenen wat er gemiddeld gebeurt. Dat is dit korte thema: rekenen aan een discrete kansvariabele.

OpmerkingWat is een discrete kansvariabele?

Een variabele met een beperkt aantal waarden (discreet — je moet springen van de ene naar de andere), waarvan de kansen bekend zijn. Omdat de kansen bekend zijn, gaat het eigenlijk over de hele populatie: we hoeven niks te schatten, we wéten hoe vaak elke waarde valt.

De kraaiendobbelsteen, \(X\) = aantal ogen:

\(i\) \(x_i\) \(p_i\)
1 1 0,20
2 2 0,20
3 3 0,20
4 4 0,20
5 5 0,10
6 6 0,10
1,00

De verwachtingswaarde = een gewogen gemiddelde

Wat is de gemiddelde uitkomst? Niet gewoon \((1+2+\dots+6)/6\) — want de lage ogen tellen zwaarder mee, die vallen vaker. Je moet elke waarde wegen met zijn kans. Dat is de verwachtingswaarde:

\[\mu_x = E(X) = \sum p_i\, x_i\]

Dit is precies hetzelfde idee als het gewone gemiddelde (Deel 1) en het gemiddelde uit een frequentietabel (thema 2) — alleen weeg je nu met kansen in plaats van frequenties.

\(i\) \(x_i\) \(p_i\) \(p_i \cdot x_i\) \((x_i - \mu_x)^2 \cdot p_i\)
1 1 0,20 0,20 \((1-3{,}1)^2 \cdot 0{,}20 = 0{,}882\)
2 2 0,20 0,40 \(1{,}21 \cdot 0{,}20 = 0{,}242\)
3 3 0,20 0,60 \(0{,}01 \cdot 0{,}20 = 0{,}002\)
4 4 0,20 0,80 \(0{,}81 \cdot 0{,}20 = 0{,}162\)
5 5 0,10 0,50 \(3{,}61 \cdot 0{,}10 = 0{,}361\)
6 6 0,10 0,60 \(8{,}41 \cdot 0{,}10 = 0{,}841\)
\(\mu_x = 3{,}1\) \(\sigma_x^2 = 2{,}49\)

Dus \(\mu_x = 3{,}1\). Kun je een 3,1 gooien? Nee. Maar het is wél de verwachting — het gemiddelde als je oneindig vaak zou gooien.

De variantie van een kansvariabele

Dezelfde gedachte als in Deel 1 (de blauwe vierkantjes), maar weer gewogen met de kans:

\[\sigma_x^2 = \sum (x_i - \mu_x)^2 \, p_i = 2{,}49, \qquad \sigma_x = \sqrt{2{,}49} \approx 1{,}58\]

(De rechterkolom van de tabel hierboven, opgeteld.)

Wat als de spelregels veranderen? Lineaire transformatie

De kraai zegt: je betaalt €10 inleg, en krijgt €5 per geworpen oog terug. Je winst is dan \(Y = -10 + 5X\) — een lineaire transformatie (\(a = -10\), \(b = 5\)). Wat is je verwachte winst en de spreiding?

  • Gemiddelde schuift én schaalt mee: \(\mu_Y = a + b\,\mu_x = -10 + 5 \cdot 3{,}1 = 5{,}5\). (Verwachte winst €5,50 — de kraai heeft slecht gerekend.)
  • Variantie: \(\sigma_Y^2 = b^2 \, \sigma_x^2 = 5^2 \cdot 2{,}49 = 62{,}25\).
  • Standaardafwijking: \(\sigma_Y = |b| \, \sigma_x = 5 \cdot 1{,}58 = 7{,}89\) ( \(= \sqrt{62{,}25}\), klopt).
BelangrijkLet op: de variantie krijgt b-kwadraat

De makkelijkste fout (ik trap er zelf soms even in): bij de variantie staat \(b^{2}\), niet \(b\). De standaardafwijking krijgt \(|b|\). Logisch ook: een variantie leeft in “kwadraten” (denk aan de vierkantjes uit Deel 1), dus een schaalfactor telt daar gekwadrateerd. Een constante \(a\) erbij verschuift alleen het midden en doet niets met de spreiding.

TipBruggetje naar straks

Onthoud \(\sigma_Y^2 = b^2\sigma_x^2\) goed — want precies díé regel verklaart in Deel 4 waarom de standaardfout \(\sigma_{\bar{x}} = \sigma_x / \sqrt{n}\) is. Een steekproefgemiddelde is óók een (gewogen) optelling, en de variantie schaalt mee met het kwadraat. Hier leg je dat fundament.

Oefenen

OpmerkingT4.1 — Eerlijke dobbelsteen

Neem nu een eerlijke dobbelsteen: elk oog kans \(1/6\). (a) Wat is \(\mu_x = E(X)\)? (b) Kun je dat oog ook echt gooien?

(a) \(\mu_x = \sum p_i x_i = \tfrac{1}{6}(1+2+3+4+5+6) = \tfrac{21}{6} = 3{,}5\).

(b) Nee — een 3,5 bestaat niet op de dobbelsteen. De verwachtingswaarde is een gemiddelde, geen mogelijke uitkomst.

OpmerkingT4.2 — Andere spelregels

Bij de eerlijke dobbelsteen (\(\mu_x = 3{,}5\), en reken zelf na dat \(\sigma_x^2 \approx 2{,}92\)). De uil verandert het spel: \(Y = 2 + 3X\) punten. Wat worden \(\mu_Y\), \(\sigma_Y^2\) en \(\sigma_Y\)?

\(\mu_Y = a + b\mu_x = 2 + 3 \cdot 3{,}5 = 12{,}5\).

\(\sigma_Y^2 = b^2 \sigma_x^2 = 3^2 \cdot 2{,}92 = 9 \cdot 2{,}92 = 26{,}28\) (let op: \(b^2 = 9\), niet 3).

\(\sigma_Y = |b|\,\sigma_x = 3 \cdot \sqrt{2{,}92} = 3 \cdot 1{,}71 = 5{,}13\) (\(=\sqrt{26{,}28}\)).

Tot slot

Een discrete kansvariabele reken je net als een gewone groep — alleen weeg je met kansen: de verwachtingswaarde is een gewogen gemiddelde, de variantie een gewogen optelling van vierkantjes. En verander je de spelregels lineair, dan schuift het gemiddelde mee en schaalt de variantie met \(b^2\). Dat laatste komt straks terug als de motor onder de standaardfout.


Werkboek OZP 1 · Thema 4, versie 0.1 (handrekenen & theorie; SPSS later).

Terug naar boven