[ Home | Vorige | Volgende ]

De schoenmaten van 9 vrouwen en 2 mannen zijn:

vrouwen = c(37,41,38,36,38,38,41,40,41)
mannen = c(42,42)

Om te zien of deze twee groepen significant van elkaar verschillen, kun je de volgende t-toets doen:

t.test (vrouwen, mannen)
## 
##  Welch Two Sample t-test
## 
## data:  vrouwen and mannen
## t = -4.9115, df = 8, p-value = 0.001177
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -4.571805 -1.650417
## sample estimates:
## mean of x mean of y 
##  38.88889  42.00000

Dit is ook wat Stefan Gries doet op pagina 330 van het boek, nadat hij heeft bepaald dat de varianties in de twee groepen niet significant van elkaar verschillen. Dit is hoe het wel moet:

t.test (vrouwen, mannen, var.equal = TRUE)
## 
##  Two Sample t-test
## 
## data:  vrouwen and mannen
## t = -2.2213, df = 9, p-value = 0.05345
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -6.27941645  0.05719422
## sample estimates:
## mean of x mean of y 
##  38.88889  42.00000

Als je niet var.equal=TRUE zegt, dan denkt R dat je wilt poneren dat de varianties in de twee groepen van elkaar verschillen. Alle toetsen die we verder nog tegenkomen (variantieanalyse, lineaire regressie, logistische regressie) gaan uit van gelijke variantie in de groepen, en dat had eigenlijk de “default” moeten zijn in R (“default” betekent ‘de standaardinstelling die je krijgt als je niet expliciet een waarde opgeeft’).

De p-waarde is nu net iets hoger dan 0.05, en dus omvat het 95%-betrouwbaarheidsinterval nog net 0. We kunnen de nulhypothese net niet verwerpen, en we kunnen dus net niet concluderen dat Nederlandse mannen gemiddeld grotere schoenen hebben dan Nederlandse vrouwen.

Bij een tabel zoals in §2.7, waar alle deelnemers onder elkaar staan, gebruik je het selectiemechanisme van §2.8 om groepen te vergelijken die in de tabel boven elkaar staan:

tabel
##    proefpersoon geslacht jaar geslaagd
## 1            CW        V   13        0
## 2            AB        V    3        1
## 3            PB        M   28        1
## 4            SJ        V    3        1
## 5            SH        V   21        1
## 6            WP        V    5        1
## 7            VR        V   11        1
## 8            AR        V   13        0
## 9            TW        M   48        0
## 10           DW        M   36        0
t.test (tabel$jaar [tabel$geslacht=="M"],
  tabel$jaar [tabel$geslacht=="V"], var.equal=TRUE)
## 
##  Two Sample t-test
## 
## data:  tabel$jaar[tabel$geslacht == "M"] and tabel$jaar[tabel$geslacht == "V"]
## t = 5.2196, df = 8, p-value = 0.0008029
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  15.33737 39.61501
## sample estimates:
## mean of x mean of y 
## 37.333333  9.857143

De conclusie is dan dat vrouwen gemiddeld lager scoren op “jaar” dan mannen.

[ Home | Vorige | Volgende ]