Thema 9 · t-toets
Deel 5 — Toetsen · de σ die we niet kennen
Van z naar t: σ kennen we nooit
In thema 8 deden we alsof we \(\sigma_x\) kennen. Dat is een prettige fictie voor het uitleggen, maar in de echte wereld komt zo’n populatie-standaardafwijking nooit kant-en-klaar binnenwaaien. We schatten \(\sigma_x\) met de standaardafwijking van onze steekproef: \(s_x\). En dat extra schatten kost ons iets — vandaar een nieuwe verdeling: de t-verdeling.
Wat verandert er?
Drie dingen, en eigenlijk maar drie:
- De standaardfout wordt geschat: \(SE_{\bar{x}} =s_x / \sqrt{n}\) in plaats van \(\sigma_x / \sqrt{n}\).
- De toetsingsgrootheid heet \(t\) in plaats van \(z\) — zelfde formule, andere naam: \(t = \dfrac{\bar{x} - \mu_0}{SE_{\bar{x}}}\).
- We zoeken de kans op in de t-verdeling met \(n-1\) vrijheidsgraden (\(df\)), niet in de z-tabel.
Voor onze egels: \(SE_{\bar{x}} =15/\sqrt{25} = 3\) (toevallig gelijk aan thema 8 — handig voor het vergelijken). \(df = n - 1 = 24\).
De t-verdeling: z, maar met extra onzekerheid in de staarten
De t-verdeling lijkt op de standaardnormale, maar heeft dikkere staarten — meer kans op extreme uitkomsten. Dat is precies wat je krijgt als je \(\sigma\) door \(s\) vervangt: \(s\) is zelf ook een schatting met ruis, dus de hele toetsstatistiek wordt iets onzekerder. Hoe groter \(n\) (dus \(df\)), hoe beter \(s\) de echte \(\sigma\) benadert, en hoe meer de t-verdeling op de z-verdeling lijkt. Bij \(df = \infty\) valt t samen met z.
De snelle weg (3 regels, overzicht)
Voor de egels (\(\bar{x} = 106\), \(s_x = 15\), \(n = 25\), \(\mu_0 = 100\), eenzijdig, \(\alpha = .05\)):
- Standaardiseer: \(t = \dfrac{\bar{x} - \mu_0}{SE_{\bar{x}}} = \dfrac{106 - 100}{3} = 2{,}00\) met \(df = 24\).
- Zoek de kans: \(p = .028\) (rechterstaart, t-tabel df = 24). \(p < .05\).
- Beslis: verwerp de nulhypothese.
Conclusie: ook zonder \(\sigma_x\) als cadeau scoren egels significant boven de norm van 100. Klaar.
De lange weg — het toets-stappenplan
Stap 1 · Onderzoeksvraag. Zijn egels pienterder dan de norm van 100?
Stap 2 · Hypothesen. \(H_0: \mu_x = 100\). \(H_1: \mu_x > 100\) (rechtszijdig).
Stap 3 · Toetskeuze. Eén gemiddelde, \(\sigma_x\) onbekend → één-steekproefs t-toets (in plaats van z).
Stap 4 · Laat \(H_0\) waar zijn en teken de steekproevenverdeling. Onder \(H_0\) ligt het centrum op \(\mu_0 = 100\) met geschatte standaardfout \(SE_{\bar{x}} =15/\sqrt{25} = 3\). De rechterstaart van 5% (= \(\alpha\)) is het verwerpingsgebied — maar nu met t (df = 24), niet met z:
Stap 5 · Toetsingsgrootheid. \(t = \dfrac{\bar{x} - \mu_0}{SE_{\bar{x}}} = \dfrac{106 - 100}{3} = 2{,}00\).
Stap 6 · p-waarde of kritieke waarde.
- p-waarde: in de t-tabel bij \(df = 24\) hoort bij \(t = 2{,}00\) een eenzijdige \(p \approx .028\). (Vergelijk T8: voor \(z = 2{,}00\) was \(p = .023\). T levert iets hogere \(p\) — de dikkere staart.)
- Kritieke waarde: bij \(\alpha = .05\) eenzijdig en \(df = 24\) is \(t^* = 1{,}711\). Dus \(\bar{x}_c = 100 + 1{,}711 \cdot 3 = 105{,}13\). De gevonden \(\bar{x} = 106 > 105{,}13\) → verwerpen.
Stap 7 · Statistische beslissing. Verwerp de nulhypothese (\(t = 2{,}00\), \(df = 24\), \(p = .028\), eenzijdig, \(\alpha = .05\)).
Stap 8 · Inhoudelijke conclusie. Bij egels ligt de gemiddelde pienterheid significant boven de norm van 100 — ook nu we \(\sigma_x\) niet kenden en met \(s_x\) moesten werken.
Het t-betrouwbaarheidsinterval
Net als in thema 7 kun je rond \(\bar{x}\) een interval bouwen, maar nu met \(t^*\) in plaats van \(z^*\) en met \(SE_{\bar{x}}\) in plaats van \(\sigma_{\bar{x}}\):
\[\bar{x} \pm t^* \cdot SE_{\bar{x}}\]
Voor 95% tweezijdig bij \(df = 24\): \(t^* = 2{,}064\) (uit de t-tabel). Dus \(106 \pm 2{,}064 \cdot 3 = 106 \pm 6{,}19 = [99{,}81\,;\,112{,}19]\). Iets breder dan T8’s \(z\)-CI \([100{,}12\,;\,111{,}88]\) — de prijs van het schatten. Let op: hier ligt 100 wél nét binnen het interval — dus bij een tweezijdige toets (\(\alpha = .05\), \(H_1: \mu \neq 100\)) zou je deze nét niet verwerpen. Eenzijdig wel.
Twee andere t-toetsen — kort
Tot nu toe één steekproef tegen een norm. In de echte wereld vergelijk je vaker twee dingen:
In OZP 1 oefen je vooral de één-steekproefs versie; de andere twee komen verderop in je studie. De gedachte is steeds dezelfde: een verschil delen door zijn standaardfout, en kijken hoe extreem dat is onder \(H_0\).
Oefenen
Wat blijft liggen
We toetsten alleen gemiddelden. In thema 10 vragen we ons af: hoe goed vángt deze toets een echt effect? — dat is power. En in thema 11 stappen we over op categorieën (chi-kwadraat).
Tot slot
Z en t zijn familieleden. Z is het ideaal, t de werkelijkheid: een beetje extra onzekerheid omdat we \(\sigma\) schatten. De stappen blijven gelijk, de figuur blijft gelijk, alleen de tabel verandert. En vergeet niet — drie regels voor de snelle weg, acht stappen voor de lange weg met figuur.
Werkboek OZP 1 · Thema 9, versie 0.1 (handrekenen & theorie; SPSS later). Doorlopend voorbeeld: de egels.