[ Home | Vorige | Volgende ]

Het rekenkundig gemiddelde van de getallen 30, 40 en 50 zie je zo op het oog, en voor R is het ook niet moeilijk:

a = c(30, 40, 50)
mean (a)
## [1] 40

Deze is al moeilijker met het oog te zien:

a = c(30, 40, 80)
mean (a)   # het gemiddelde van de drie getallen
## [1] 50

Je had hem kunnen uitrekenen door de drie getallen bij elkaar op te tellen, en dan te delen door het aantal:

(30 + 40 + 80) / 3
## [1] 50

Dat had je ook met bekende R-functies kunnen doen:

sum (a) / length (a)
## [1] 50

De mediaan van een rijtje getallen kun je zien als je het rijtje sorteert:

b = c(78, 45, 89, 12, 40, 333, 22, 0, -4, 7)
c = sort (b)
c
##  [1]  -4   0   7  12  22  40  45  78  89 333

Het midden van deze getallen ligt tussen de 22 en de 40: dan ligt de helft van de getallen links en de helft rechts. Het is dan gebruikelijk om het rekenkundig gemiddelde van 22 en 40, dus 31, tot mediaan te benoemen, en inderdaad:

median (b)
## [1] 31

Als je rijtje hebt met een oneven aantal elementen, is de mediaan gewoon het middelste element:

median (c(30, 80, 40))
## [1] 40

De mediaan is meteen ook het 50ste percentiel:

quantile (b, 0.50)
## 50% 
##  31

De functies hierboven hebben allemaal extra mogelijke argumenten. Zie daarvoor Help in het venster rechtsonder in RStudio, of type ?mean of help (mean) in de Console als je iets over de functie mean wilt weten. De voorbeelden die je in de Help ziet, kun je in de Console runnen door copy-paste te doen, of in één keer door example (mean) te doen.

[ Home | Vorige | Volgende ]