【まとめ】尺度開発で使えるおすすめ統計モデル【COSMIN対応】
本記事では「尺度研究に興味があります。いろんな統計モデルを使う必要があると思いますが、おすすめの統計モデルってありますか?」という疑問にお答えします。
最近、尺度開発に取り組む療法士が増えつつあり、同種の質問を受けることが増えているので記事にしました。
- 尺度開発に関心がある
- 尺度開発で使えるおすすめ統計モデルを知りたい
本題に入る前にお知らせです。私が代表を務めるThriver Projectでは、無料Webセミナーを開催しています。研究論文や研究計画書の書き方のコツを、わかりやすく丁寧に解説しています。この無料Webセミナーでは約300名以上の方が学んでおり、参加者からはたいへん好評を博しています。これらの書き方で悩んでいる方は、以下のリンクからアクセスしてください。皆さんの参加を心からお待ちしています。
【無料】IMRaDを使った研究論文の書き方講座【Webセミナー】 (thriver.one)
【無料】研究計画書の書き方講座【Webセミナー】 (thriver.one)
本記事を書いているぼくは作業療法士であり、これまでいくつかの尺度を開発してきました。
統計学は元々とても苦手です(いまも苦手)。
尺度開発は統計モデルの活用が必須なので、基本的に独学ということもあってけっこう苦労してきました(今も苦労している)。
そんなぼくが療法士向けに尺度研究で使えるおすすめ統計モデルをさくっとまとめます。
※ここで紹介する以外にもいろいろ使える統計モデルはあるし、統計モデルはほんとうに日進月歩なので、皆さんは研究目的に照らしてその都度最適な統計モデルを調べるようにしてくださいね。
【前置き】尺度開発で使えるおすすめ統計モデル
COSMIN
COSMINは尺度開発のガイドラインです。
2010年にoriginal COSMINが提案されましたが、現在その使用は非推奨です。
現在、COSMINは以下の3種類があります。
- COSMIN Study Design checklist
- COSMIN Risk of Bias checklist
- COSMIN Reporting checklist
ぼくが見つけられないだけかもしれませんが、このうちチェックリストとして入手できるのはCOSMIN Risk of Bias checklistで後は開発中のようです(2018/12/09)。
現在進行系の研究が多いので、最新情報は公式サイトで必ず確認してください。
尺度開発で重視される指標
尺度開発で重視される指標は大きくわけると以下の通り。
- 妥当性(内容妥当性(表面妥当性)、構成概念妥当性(構造的妥当性、仮説検証、異文化妥当性)、基準関連妥当性(併存的妥当性、予測的妥当性))
- 信頼性(信頼性、内的整合性、測定誤差)
- 反応性
- 解釈可能性
これらの指標は1回の研究で検証を終えられないので、対象を変えながら複数回の研究を重ねる必要があります。
本記事は基本的に上記の指標にそって使えるおすすめ統計モデルをまとめています。
なお、構成概念妥当性は妥当性概念そのものという議論もありますが、COSMINは妥当性という大きな括りの中であつかっています。
妥当性概念の詳しい議論は以下の書籍を参照してください。
教育測定学上巻
教育測定学下巻
尺度開発の手順
尺度開発するときは、基本的に次の手順で進めるとよいです。
- 内容妥当性(表面妥当性)の検討
- 基準関連妥当性(併存的妥当性、予測的妥当性)、構成概念妥当性(構造的妥当性、仮説検証、異文化妥当性)、信頼性(信頼性、内的一貫性、測定誤差)、反応性、解釈可能性
- 対象や条件を変えながら検証を繰り返す
尺度開発において、内容妥当性は非常に重要です。
内容妥当性では、尺度で測定した構成概念と項目プールを作り込みます。
項目プールは測定したい構成概念に近似した対象を測定している尺度から良好な尺度特性をもつものを選んでいくとよいです。
ここでミスると後でどうしようもなくなるので、尺度開発の成否は内容妥当性の検討にかかっているといっても過言ではないです。
その後、基準関連妥当性(併存的妥当性、予測的妥当性)、構成概念妥当性(構造的妥当性、仮説検証、異文化妥当性)、信頼性(信頼性、内的一貫性、測定誤差)、反応性、解釈可能性などについて検討を行います。
尺度開発はプロセスとして捉える必要があるので、1度の研究で終えることなく対象者や条件を変えながら検証していく必要があります。
尺度開発で使えるおすすめ統計モデル
以上を踏まえて、尺度開発で使えるおすすめ統計モデルは以下の通り。
ここに示した統計モデルは一例に過ぎないので、統計モデルを使用する前は必ずご自身でもより適した方法を調べるようにしてくださいね。
また、ぼくが知らないだけで、もっと良い統計モデルがある可能性もあるので、ご存じの方がいましたらblogの問合せフォームからご連絡くださるとうれしいです。
目的 | 統計モデルの例 | 統計ソフトの例 |
内容妥当性 | 記述統計、内容妥当性比 など | R、HAD など |
構造的妥当性 | 因子分析、項目反応理論 など | R、Mplus、Exametrika など |
仮説検証 | 多特性多方法行列、CT-CMモデル、平均分散抽出と因子間相関の平方による検討 など | R、Mplus など |
異文化妥当性 | 多母集団同時分析、特異項目機能(項目反応理論) など | R、Mplus、Exametrika など |
併存的妥当性 | 相関分析 など | R、Mplus、HAD など |
予測的妥当性 | 相関分析、回帰分析、AUC など | R、Mplus、HAD など |
信頼性 | 古典的テスト理論、項目反応理論、級内相関係数 など | R など |
内的整合性 | ω係数、α係数 など | R、HAD など |
測定誤差 | 測定の標準誤差(SEM)、最少可変化量、誤差の許容範囲 など | R など |
反応性 | 感度と特異度、AUC、相関係数 など | R など |
解釈可能性 | 標準化、カットオフ、MIC、最少可変化量、潜在ランク理論 など | R、Mplus、Exametrikaなど |
頑健性 | 多母集団同時分析 など | R、Mplus など |
上記の統計モデルのうち因子分析、項目反応理論、多特性多方法行列、CT-CMモデル、多母集団同時分析などは構造方程式モデルで実行します。
なので、構造方程式モデルの習得は尺度研究で必須です。
また、統計ソフト例を見るとわかるように、Rを使えるようになるといろんな指標を検証できるので、尺度開発を進めやすくなります。
「Rって難しい!」という療法士が多いですけども、勉強して使えるようになった方がいいです。
まとめ:尺度開発で使えるおすすめ統計モデル
本記事では「尺度研究に興味があります。いろんな統計モデルを使う必要があると思いますが、おすすめの統計モデルってありますか?」という疑問にお答えしました。
尺度開発で使えるおすすめ統計モデルは上記の表に示したので、この記事を読んだ人が必要に応じて活用してくれるとうれしいです。
そして、上述したように、Rの活用はわりと重要なので使えるようになった方がいいですよ。
いますぐRを学んでデータ解析スキルを向上する
Rではじめる統計基礎講座:Q&A付きの動画教材。講師に質問可。統計の基礎知識からRで実装する方法まで学べます。