観察研究は無作為化試験より過大評価になる？／BMJ

提供元：ケアネット

公開日：2016/02/23

　診療記録や患者登録など、規定どおりに収集された医療データ（routinely collected health data：RCD）を用いた観察研究は、同じclinical question（CQ）に関してその後に行われた無作為化試験とは異なる答えをもたらし、実質的に治療効果を過大に評価している可能性があることが、米国・スタンフォード大学のLars G Hemkens氏らの検討で示された。研究の成果は、BMJ誌オンライン版2016年2月8日号に掲載された。無作為化試験が行われていない場合、診療の意思決定の支援にRCDによる観察研究が活用される機会が増えているという。一方、観察研究は、交絡による固有のバイアスのリスクがあり、RCDには正確性や信頼性の面でも問題があるとされる。

2種の試験で、死亡の抑制効果を比較

　研究グループは、RCDを用いた観察研究と、その後に同じCQについて行われた無作為化対照比較試験のエビデンスの間に、死亡の抑制効果に関してどの程度の差があるかを検討した。

　RCD試験は、2010年までに公表され、傾向スコアを用いて交絡バイアスを調整し、死亡への相対的な介入効果の記載があるものとした。解析には、同一のトピックに関する既報の臨床試験に先立って行われたRCD試験のみを含めた。

　RCD試験と無作為化対照比較試験で、治療効果、信頼区間（CI）、効果量（effect size、オッズ比[OR]）を比較した。ランダム効果モデルで複数の試験をメタ解析的に統合してサマリーオッズ比（OR）を算出し、相対OR（無作為化試験のサマリーORをRCD試験の推定ORで除したもの）およびサマリー相対ORを得た。

　サマリー相対OR＞1の場合に、RCD試験のほうがその後の臨床試験よりも死亡率の結果がより良好であると判定した。

無作為化試験よりも治療効果が31％も高い

　16件のRCD試験（12件が循環器関連）と、同一のCQを検討した36件の無作為化対照比較試験（1万7,275例、死亡例835例）が解析の対象となった。RCD試験終了から無作為化試験の報告までの期間中央値は3年だった。

　16のCQのうち8つのRCD試験で有意な差が認められた。5つ（31％）のCQでは、無作為化試験の死亡への治療効果が、RCD試験とは逆であった。これら5つのCQの無作為化試験はいずれも有意な差はなかったが、RCD試験は1つの試験で有意差がみられた。

　9つ（56％）のRCD試験では、そのCI内に無作為化試験の死亡への効果の推定ORが含まれなかった。また、全体では、RCD試験の死亡抑制効果の推定ORは無作為化試験よりも31％有意に優れていた（サマリー相対OR：1.31、95％CI：1.03～1.65、I²＝0％）。

　著者は、「RCDを用いた観察研究は、最良の治療法に関して必ずしも最も信頼性の高い答えをもたらさないことが示唆されるため、臨床的な意思決定が間違った方向に導かれないよう注意を払う必要がある」と結論し、「無作為化試験がない場合、治療効果はRCD試験の知見よりも不確定で、より小さい可能性を考慮すべきであり、無作為化試験のエビデンスが確立されるまでは、高価な介入は差し控えるのがよいかもしれない」と指摘している。

（医学ライター　菅野守）

専門家はこう見る

診療録ビッグデータを治療効果の検証には使うべきではない（解説：折笠秀樹氏）－486