Cronbachs alfa

Cronbachs α (alfa) is een maat voor de betrouwbaarheid van psychometrische tests of van vragenlijsten.[1] De waarde van α {\displaystyle \alpha } is een schatting voor de ondergrens van de betrouwbaarheid van de betrokken test. Om een schatting te bepalen van de betrouwbaarheid van een test zijn ten minste twee testafnames nodig. Op basis van één testafname kan Cronbachs α {\displaystyle \alpha } berekend worden om zo een schatting van de ondergrens te verkrijgen. Cronbachs α {\displaystyle \alpha } hangt af van het aantal items of vragen in de test, de gemiddelde covariantie tussen de items en de spreiding van de somscore.[2]

Cronbachs α {\displaystyle \alpha } is ontwikkeld door Lee Cronbach, die hem in 1951 voor het eerst gebruikte. Andere, verwante maten zijn de Kuder-Richardson Formule 20, kortweg KR-20, en lambda-2 van Guttman.

Cronbachs α {\displaystyle \alpha } kan waarden aannemen van minus oneindig tot 1 (waarbij wordt opgemerkt dat alleen positieve waarden zinvol zijn). Als vuistregel wordt vaak gehanteerd dat een test of onderzoeksvragenlijst bruikbaar is bij een α {\displaystyle \alpha } van 0,70 of hoger, hoewel de gebruiken verschillen per onderzoeksdiscipline. Intelligentietests hebben vaak een hogere waarde voor α {\displaystyle \alpha } dan tests voor attitude of persoonlijkheid.

In de psychologie en sociologie wordt Cronbachs α {\displaystyle \alpha } frequent toegepast, maar ook in andere wetenschappen is het een belangrijke maat.

Om duidelijk te maken dat Cronbachs α {\displaystyle \alpha } een schatting is van de betrouwbaarheid die is gebaseerd op louter één testafname, wordt ook wel gezegd dat Cronbachs α {\displaystyle \alpha } een schatting is van de interne consistentie van een instrument. Deze term wordt helaas vaak verkeerd begrepen, namelijk als indicator van constructvaliditeit of dimensionaliteit. Clustering van items is echter niet terug te zien in de waarde van α {\displaystyle \alpha } , omdat er bij de berekening van α {\displaystyle \alpha } gebruik wordt gemaakt van de gemiddelde covariantie. Mede daarom is het geen goede maat voor dimensionaliteit/factor structuur. Een hoge waarde van α {\displaystyle \alpha } impliceert dus niet noodzakelijkerwijs dat de test enkel één construct meet. Daarom raden verschillende auteurs aan om de term interne consistentie te vermijden. Als men een uitspraak wil doen over de dimensionaliteit van een test, is het beter om factoranalyse of item respons theorie[3] te gebruiken.

Definitie

In de klassieke testtheorie wordt de score X {\displaystyle X} op een test bepaald als het totaal van de scores Y i {\displaystyle Y_{i}} op N {\displaystyle N} afzonderlijke items:

X = Y i = T i + E i {\displaystyle X=\sum Y_{i}=\sum T_{i}+\sum E_{i}}

De score Y i {\displaystyle Y_{i}} op item i {\displaystyle i} wordt daarin opgevat als de som van de true score T i {\displaystyle T_{i}} en een storingsterm, de error score, E i {\displaystyle E_{i}} :

Y i = T i + E i {\displaystyle Y_{i}=T_{i}+E_{i}}

daarin zijn de true score en de error score ongecorreleerd, en ook worden de error scores van de verschillende items als ongecorreleerd beschouwd. Bovendien is de verwachte error score 0:

E ( E i ) = 0 {\displaystyle \operatorname {E} (E_{i})=0}

De variantie van de totale score kan uiteengelegd worden in:

v a r ( X ) = v a r ( Y i ) = c o v ( Y i , Y j ) + v a r ( Y i ) = {\displaystyle \mathrm {var} (X)=\mathrm {var} \left(\sum Y_{i}\right)=\sum \mathrm {cov} (Y_{i},Y_{j})+\sum \mathrm {var} (Y_{i})=}
= c o v ( T i , T j ) + v a r ( T i ) + v a r ( E i ) {\displaystyle =\sum \mathrm {cov} (T_{i},T_{j})+\sum \mathrm {var} (T_{i})+\sum \mathrm {var} (E_{i})}

De onbetrouwbaarheid in de testscore vindt z'n oorzaak in de varianties van de true scores en de error scores. Daarom kan de betrouwbaarheid worden afgemeten aan:

v a r ( X ) v a r ( T i ) v a r ( E i ) v a r ( X ) = c o v ( T i , T j ) v a r ( X ) = {\displaystyle {\frac {\mathrm {var} (X)-\sum \mathrm {var} (T_{i})-\sum \mathrm {var} (E_{i})}{\mathrm {var} (X)}}={\frac {\sum \mathrm {cov} (T_{i},T_{j})}{\mathrm {var} (X)}}=}
= v a r ( X ) v a r ( Y i ) v a r ( X ) = 1 v a r ( Y i ) v a r ( X ) {\displaystyle ={\frac {\mathrm {var} (X)-\sum \mathrm {var} (Y_{i})}{\mathrm {var} (X)}}=1-{\frac {\sum \mathrm {var} (Y_{i})}{\mathrm {var} (X)}}}

Deze parameter is maximaal gelijk aan ( N 1 ) / N {\displaystyle (N-1)/N} . Zie ter illustratie Voorbeeld 1. Ter normering wordt de betrouwbaarheid daarom gedefinieerd als:

N N 1 ( 1 v a r ( Y i ) v a r ( X ) ) {\displaystyle {\frac {N}{N-1}}\left(1-{\frac {\sum \mathrm {var} (Y_{i})}{\mathrm {var} (X)}}\right)}

De waarde van de betrouwbaarheid is maximaal 1 en naar beneden onbegrensd. Het is deze parameter waarvan Cronbachs α {\displaystyle \alpha } een schatting geeft.

α = N N 1 ( 1 i = 1 N S Y i 2 S X 2 ) {\displaystyle \alpha ={\frac {N}{N-1}}\left(1-{\frac {\sum _{i=1}^{N}S_{Y_{i}}^{2}}{S_{X}^{2}}}\right)} ,

daarin stellen de verschillende S 2 {\displaystyle S^{2}} respectievelijk de steekproefvarianties voor van de totale score X {\displaystyle X} en de scores op de items Y i {\displaystyle Y_{i}} .

Als Y i k {\displaystyle Y_{ik}} de score is van testpersoon k {\displaystyle k} op item i {\displaystyle i} en er zijn m {\displaystyle m} testpersonen, dan zijn de benodigde formules:

S Y i 2 = 1 m 1 k = 1 m ( Y i k Y i ) 2 , {\displaystyle S_{Y_{i}}^{2}={\frac {1}{m-1}}\sum _{k=1}^{m}(Y_{ik}-Y_{i\cdot })^{2},}

waarin

Y i = 1 m k = 1 m Y i k {\displaystyle Y_{i\,\cdot }={\frac {1}{m}}\sum _{k=1}^{m}Y_{ik}}

de gemiddelde score op item i {\displaystyle i} is, en

S X 2 = 1 m 1 k = 1 m ( X k X ¯ ) 2 , {\displaystyle S_{X}^{2}={\frac {1}{m-1}}\sum _{k=1}^{m}(X_{k}-{\bar {X}})^{2},}

waarin

X k = i = 1 N Y i k {\displaystyle X_{k}=\sum _{i=1}^{N}Y_{ik}}

de testscore van testpersoon k {\displaystyle k} is.

Voorbeeld

Een eenvoudig getallenvoorbeeld demonstreert de berekeningen. In de tabel staan van 3 items ( N = 3 {\displaystyle N=3} ) de itemscores y {\displaystyle y} van 5 testpersonen ( m = 5 {\displaystyle m=5} ) en als rijsom de testscores x {\displaystyle x} .

item 1 2 3 rijsom
itemscore testscore
testpersoon y 1 {\displaystyle y_{1}} y 2 {\displaystyle y_{2}} y 3 {\displaystyle y_{3}} x {\displaystyle x}
1 4 3 5 12
2 2 0 3 5
3 1 1 2 4
4 3 2 4 9
5 4 2 3 9
variantie 10,70
variantie 1,7 1,3 1,3 4,30

In de onderste rijen staat de variantie S X 2 = 10 , 70 {\displaystyle S_{X}^{2}=10{,}70} van de 5 testscores en de 3 varianties S i 2 {\displaystyle S_{i}^{2}} van de itemscores met hun totaal S i 2 = 4 , 30 {\displaystyle \sum S_{i}^{2}=4{,}30} . Voor α {\displaystyle \alpha } berekenen we dan:

α = 3 2 ( 1 4 , 30 10 , 70 ) = 0 , 90 {\displaystyle \alpha ={\frac {3}{2}}\left(1-{\frac {4{,}30}{10{,}70}}\right)=0{,}90}

Gestandaardiseerde items

Als de items gestandaardiseerd zijn, dat wil zeggen met variantie 1, kan de betrouwbaarheid geschreven worden als:

N N 1 c o v ( T i , T j ) v a r ( X ) = N N 1 ρ ( T i , T j ) N + ρ ( T i , T j ) = {\displaystyle {\frac {N}{N-1}}{\frac {\sum \mathrm {cov} (T_{i},T_{j})}{\mathrm {var} (X)}}={\frac {N}{N-1}}{\frac {\sum \rho (T_{i},T_{j})}{N+\sum \rho (T_{i},T_{j})}}=}
= N N 1 N ( N 1 ) ρ ¯ N + N ( N 1 ) ρ ¯ = N ρ ¯ 1 + ( N 1 ) ρ ¯ {\displaystyle ={\frac {N}{N-1}}{\frac {N(N-1){\bar {\rho }}}{N+N(N-1){\bar {\rho }}}}={\frac {N\cdot {\bar {\rho }}}{1+(N-1)\cdot {\bar {\rho }}}}}

Als schatter kan dan gebruikt worden:

α = N r ¯ 1 + ( N 1 ) r ¯ {\displaystyle \alpha ={\frac {N\cdot {\bar {r}}}{1+(N-1)\cdot {\bar {r}}}}}

Hierin staat r ¯ {\displaystyle {\bar {r}}} voor de gemiddelde onderlinge steekproefcorrelatie tussen de items.

Gebruik

Cronbachs α {\displaystyle \alpha } kan in verschillende fasen van een onderzoek gebruikt worden.

Onderzoeksfase Toepassing
Vooraf Bij de ontwikkeling van psychometrische tests, door de test voor te leggen aan een groot aantal proefrespondenten alvorens hem in de praktijk toe te passen
Bij de ontwikkeling van een onderzoeksvragenlijst, door hem voor te leggen aan een aantal proefrespondenten alvorens het onderzoek met deze vragenlijst uit te voeren
Tijdens Bij de uitvoering van een onderzoek met een onderzoeksvragenlijst, door items alsnog te verwijderen als ze bij deze onderzoeksgroep Cronbachs α {\displaystyle \alpha } nadelig blijken te beïnvloeden
Achteraf Cronbachs α {\displaystyle \alpha } geeft een maat voor de betrouwbaarheid van de data. Als bijvoorbeeld een enquête willekeurig is ingevuld of data verzonnen zijn, kan dit leiden tot een lage waarde van α[4]
Bronnen, noten en/of referenties
  1. Nunnally, J.C. (1978): 'Assessment of Reliability' in Psychometric Theory, McGraw-Hill.
  2. Sijtsma, K. (2009): 'Over misverstanden rond Cronbachs alfa en de wenselijkheid van alternatieven' in De Psycholoog, Volume 44, p. 561 - 567. Gearchiveerd op 4 juli 2022.
  3. Embretson, S.E.; Reise, S. (2000): Item Response Theory For Psychologists, Erlbaum
  4. [1] Maarten Keulemans in de Volkskrant van 21/01/2012: Ontmaskering frauderende Stapel werd maandenlang voorbereid