■信頼性係数の計算○ ExcelからRコマンダーを用いて信頼性係数を求めるには
|
(*1) RおよびRコマンダーのインストール方法については別途参照 (*2) ExcelファイルをRにインポートする方法については別途参照・・・なお,Excelファイルは複数のシートから成っていてもよいが,インポートすべきシートにおいてはセルA1から行方向に列のラベルが並んでいて,行のラベルはない方が失敗しにくい.特に下の表2のようにA列にデータの整理番号などの「数字からなるラベル」があると他のデータと混乱しやすいので注意 Alpha reliability = 0.7753
Standardized alpha = 0.7758 Reliability deleting each item in turn: Alpha Std.Alpha r(item, total)
|
○ 信頼性係数とは テスト結果の内部的一貫性を示す信頼性係数という指標は古典的テスト理論の重要な成果の1つだと言われている. 同じテストを繰り返し行ったときに同じ結果が得られるかどうか,すなわち再現性を調べたいときに同じ条件で何度もテストを行うのは困難なことが多いので,1回のテストから得られたデータを統計的に処理することによってこれを推定していく手法として考案されたもの. 中でもスピアマン・ブラウンの公式,クロンバックのα係数が有名である. |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
○ I-T相関,I-R相関とは テスト項目・質問項目が幾つかあるとき(表1ではp1〜p10まで10項目となっている),各項目の得点(item score)と合計得点(total score)との相関係数が高いときには,各項目で測定されている内容とテスト全体で測定されている内容の一貫性・整合性が高いと考えることができる. そこで,各項目と合計得点との相関係数をその項目の信頼性の指標として用いるのが項目-テスト相関(I−T相関)である. ところが,合計得点にはその項目の得点も含まれているため項目数が全部で3,4項目というように少ないときにI−T相関を用いると実態以上に高くなりやすい. そこで,各項目(item score)とその項目を除いた残りの項目の合計得点(remainder score)との相関係数(I-R相関)を用いるとその項目の得点が含まれるのを防ぐことができる.もちろん,項目数が多いときにもI-R相関を計算してもよく,常にI-R相関で計算すると決めておくと基準がはっきりして比較しやすくなる. Rコマンダーにおいて「Reliability deleting each item in turn:各項目を順に取り除いた信頼性係数」と書かれているのは,その項目を除いたものとの関係であることを示している. 表1の(項目名を第1列とするとき)第4列に表示されているのがこのI-R相関になっている. |
I-T相関 I-R相関 ※IーR相関の値と信頼性の目安について書かれた書物をなかなか見つけられないが,筆者の行ったテストでは高いときは0.7〜0.8程度,低いときは0.3程度の値になることがある. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
○ クロンバックのα係数(信頼性係数)とは 右のような4項目のテスト結果について,合計得点のばらつき(分散0.977)は「各項目ごとのばらつき」(項目ごとに計算した分散の和0.425)と「全体に共通のばらつき」から成り立っていると考えると, 表1においてはAlpha reliability = 0.7753がこれを表している. 統計においては,元のデータを加工した標準化データ(各データから平均値を引いて標準偏差で割ったもの)が用いられることが多く,標準化データから出発したときの信頼性係数がStandardized alpha = 0.7758として示されている. |
※クロンバックのα係数が0.8程度ならば十分な一貫性があり,0.7程度でもそこそこ・まあまあの一貫性があると考えられている. ※一般に,項目数が増えるとα係数は高くなるとされている. |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
(A)で定義されるクロンバックのα係数(通常単に信頼性係数といえばこれを指すことが多い)は項目全体の信頼性を1つの小数で表している.したがって,各項目ごとの信頼性はこれだけでは分からないので,「全体の信頼性係数と各項目を順に取り除いた残りの項目の信頼性係数を比較して,残りの項目の信頼性係数の方が格段に高ければその項目は信頼性が低く集計に含めない方がよい」という形で判断材料が提供されることになる. 「Reliability deleting each item in turn:各項目を順に取り除いた信頼性係数」と書かれた表の第2列はその項目を取り除いたときの残りの項目の信頼性係数,第3列は標準化データを用いたときの値を表している. |
※以上の結果を踏まえて表1の出力結果をもう一度見てみると 上の表1においてp9の項目はI-R相関が低く,α係数もp9を取り除いたときの方がよくなっている. 通常,項目数が多いほどα係数は高くなるはずであるが,項目数を減らしているのにα係数が高くなるというのは,この項目による測定の信頼性に疑問があることになる・・・実際には,この項目はよく考えなければ答えられないはずの問題を4択にして先頭の選択肢を解答にしたもので,当て推量(まぐれ当たり)が数多く発生した可能性があり,これが信頼性係数に反映していると考えられる. ⇒表1においてp9の信頼性は疑問であると判断できる. |
■[個別の頁からの質問に対する回答][信頼性係数の計算について/18.9.10]
統計は初心者なので、とても難しくとらえていますが、そんな私にもわかりやすい内容でした。
ありがとうございます。
=>[作者]:連絡ありがとう. |