Thema 8 · Toetsgevoel & z-toets
Deel 5 — Toetsen · de bakker
Twee soorten vragen
In thema 7 vroegen we: wat is \(\mu_x\)? — antwoord een getal, met een betrouwbaarheidsinterval eromheen. Nu draaien we de vraag om: ís \(\mu_x\) gelijk aan een bepaalde waarde? — antwoord ja of nee. Dat tweede is toetsen.
Lees dus altijd eerst: vragen ze om een getal (→ interval) of om een ja/nee (→ toets)?
\(H_0\), \(H_1\) en de bakker
We zetten twee hypothesen op:
- \(H_0\) (de nulhypothese): er is niets aan de hand — egels zijn gewoon 100. \(\mu_x = 100\).
- \(H_1\) (de alternatieve): er is wél iets — egels zijn pienterder. \(\mu_x > 100\) (rechtszijdig).
We toetsen altijd de nulhypothese (\(H_0\)), nooit de alternatieve — we kijken hoe verbaasd onze data ons maakt onder de aanname dat er niks aan de hand is. Waarom dat zo gaat? Het bakker-verhaal:
Dat is conditioneel denken, de kern van het hele vak: stel dat \(H_0\) waar is — hoe verbaasd ben ik dan over wat ik vond?
\(\alpha\) = hoeveel vals alarm je accepteert
Hoe klein moet die kans zijn voor je schrikt? Die grens spreken we van tevoren af: \(\alpha\), meestal 5%. Wat betekent dat eigenlijk?
De snelle weg (3 regels, overzicht)
Voor wie het patroon al kent — zo zit het toetsje in elkaar:
- Standaardiseer: \(z = \dfrac{\bar{x} - \mu_0}{\sigma_{\bar{x}}} = \dfrac{106 - 100}{3} = 2{,}00\).
- Zoek de kans: \(p = .0228\) (rechterstaart bij \(z = 2{,}00\)). \(p < .05\).
- Beslis: verwerp de nulhypothese.
Conclusie: egels scoren significant boven 100 — de pienterheid van egels ligt hoger dan de norm. Klaar.
De lange weg — het toets-stappenplan
Drie regels klinkt simpel, maar onder de motorkap zitten acht stapjes die je elke toets opnieuw doorloopt. Schrijf ze altijd uit; het ritueel bewaakt je tegen onzin.
Stap 1 · Onderzoeksvraag. Zijn egels pienterder dan de norm van 100?
Stap 2 · Hypothesen. \(H_0: \mu_x = 100\) (geen verschil). \(H_1: \mu_x > 100\) (rechtszijdig — we vermoeden hoger, niet anders).
Stap 3 · Toetskeuze. Eén gemiddelde, \(\sigma_x\) bekend → z-toets.
Stap 4 · Laat \(H_0\) waar zijn en teken de steekproevenverdeling. Onder \(H_0\) ligt het centrum op \(\mu_0 = 100\) met standaardfout \(\sigma_{\bar{x}} = 15/\sqrt{25} = 3\). De rechterstaart van 5% (= \(\alpha\)) is het verwerpingsgebied:
Stap 5 · Toetsingsgrootheid. Standaardiseer onze steekproef: \(z = \dfrac{\bar{x} - \mu_0}{\sigma_{\bar{x}}} = \dfrac{106 - 100}{3} = 2{,}00\). Twee lineaaltjes boven de verwachting.
Stap 6 · p-waarde óf kritieke waarde — twee paden, zelfde antwoord. Zie hieronder.
Stap 7 · Statistische beslissing. Beide paden zeggen hetzelfde: verwerp \(H_0\).
Stap 8 · Inhoudelijke conclusie. Effect van X op Y — en hier is X de groep (egels) en Y de pienterheid: bij egels ligt de gemiddelde pienterheid significant boven de norm van 100 (\(z = 2{,}00\), \(p = .023\), eenzijdig, \(\alpha = .05\)).
Stap 6a — Methode 1: de p-waarde (\(x \to z \to p\))
De gewone manier (ook wat SPSS doet): standaardiseer en zoek de kans op. Bij \(z = 2{,}00\) is de rechterstaart \(p = .0228\). Dat is kleiner dan \(\alpha = .05\) → verwerp de nulhypothese. De kans om 106 of hoger te vinden als egels gewoon 100 zijn, is maar 2,3% — dat is de fiets.
Stap 6b — Methode 2: de kritieke waarde (\(p \to z \to x\))
Nu andersom: bepaal vóór je de steekproef ziet vanaf welke grens je verwerpt. Die grens — de kritieke waarde \(\bar{x}_c\) — bouwen we op in drie stapjes, elk eentje moeilijker:
Onze steekproef: \(\bar{x} = 106\) ligt boven \(\bar{x}_c = 104{,}94\), dus in het verwerpingsgebied → verwerp de nulhypothese. Beide methoden geven dezelfde conclusie — natuurlijk, het is dezelfde wandeling, andere kant op.
Eén- of tweezijdig?
Onze \(H_1\) was \(\mu_x > 100\) (rechtszijdig) — we keken alleen naar de rechterstaart. Bij een tweezijdige \(H_1\) (\(\mu_x \neq 100\)) weet je de kant niet, dus kijk je naar beide staarten:
Beslissing is niet hetzelfde als werkelijkheid
Of je nu verwerpt of niet — je kunt het mis hebben, want de werkelijkheid (kent alleen God) is onbekend:
- Type-I-fout: de nulhypothese verwerpen terwijl \(H_0\) waar is (vals alarm). De kans hierop is \(\alpha\).
- Type-II-fout: de nulhypothese níét verwerpen terwijl \(H_1\) waar is (gemiste vondst).
Trek beslissing en werkelijkheid altijd los van elkaar. (De kans om een echt effect óók echt te vangen — het tegenovergestelde van een type-II-fout — heet de power; daar gaat thema 10 over.)
Toets en interval zijn elkaars spiegelbeeld
Herinner je T7: bij \(n = 9\), \(\bar{x} = 108\) vonden we het 95%-interval \([98{,}2\,;\,117{,}8]\), en 100 lag erin. Dat is precies hetzelfde als een tweezijdige toets met \(\alpha = .05\): ligt \(\mu_0\) binnen het interval → niet verwerpen; erbuiten → verwerpen. CI en toets zijn in elkaar vertaalbaar — het verschil is alleen wat je in het midden zet: bij een interval het steekproefgemiddelde, bij een toets de waarde uit \(H_0\).
Oefenen
Wat blijft liggen
Hier deden we alsof we \(\sigma_x\) kennen. In de echte wereld nooit — dan schat je ’m met \(s_x\) en gebruik je de \(t\)-verdeling (thema 9). En in thema 10 maken we het toetsgevoel compleet met de power: niet alleen “verwerp ik?”, maar “hoe goed vang ik een echt effect?”.
Tot slot
Toetsen is conditioneel denken in maat en getal: stel de nulhypothese waar, en kijk hoe verbaasd je bent. De bakker geeft het gevoel, de p-waarde en de kritieke waarde geven het getal, en \(\alpha\) is de grens die je zelf afspreekt. Drie regels voor de snelle weg, acht stappen voor de lange weg met figuur — beide leiden naar dezelfde beslissing.
Werkboek OZP 1 · Thema 8, versie 0.2 (handrekenen & theorie; SPSS later). Doorlopend voorbeeld: de egels.