「ChatGPT」による心血管予防アドバイス、どんな結果に?/JAMA

提供元:ケアネット

印刷ボタン

公開日:2023/02/24

 

 情報を検索する場合、インターネットを活用したり医療者から聞いたりするが、それらの役割がAIに置き換わったら一体どんなアドバイスをくれるのだろうか。そんな想像が人工知能 (AI) 言語モデルを用いたチャットサービス『ChatGPT』によって現実味を帯びてきた。本サービスは2022年11月にリリースされるやいなや、世界1億人以上が登録・利用している。複雑な質問に応答できることから、さまざまな専門分野で旋風を巻き起こし、医学界でも“このサービスが論文作成に悪用されるのではないか”と懸念が広がっている。

 このような世相を受け、米国・クリーブランドクリニックのAshish Sarraju氏らは単純かつ基本的な冠動脈疾患(CVD)予防の質問を『ChatGPT』に行い、本システムによる応答の適切性を定性的に評価するための研究を2022年12月に実施。JAMA誌オンライン版2023年2月3日号のリサーチレターに報告した。

 本研究ではガイドラインに基づく予防トピック、tertiary care preventive cardiology clinicsでの臨床経験に基づき、危険因子のカウンセリング、検査結果、薬歴など、基本的な予防概念に対処するための質問25項目を作成した。各質問はオンラインAIインターフェイスに3回の応答が記録された。各応答セットを「適切」「不適切」と評価し、3つの応答に一貫性がない場合は「信頼できない」と評価された。3つの応答の各セットは、心臓病の予防医学において経験豊富な臨床医が等級付けをした。回答の各セットに1人のレビュー担当者が割り当てられ、合計3人のレビュアーがこの研究に参加した。

 主な結果は以下のとおり。

・AIモデルは25項目のうち21項目(84%)で適切に回答したと評価された。
・不適切と評価された4項目のうち、3項目の回答すべてに不適切な情報が含まれていた。
・たとえば、ChatGPTは運動に関する質問に対し、有酸素運動とウエイトリフティングの両方を強く推奨したが、これは正しくはなく、特定の患者には有害の可能性があった。
・LDL-C 200mg/dLの解釈に関する質問には、家族性高コレステロール血症や遺伝的考察などに関連する詳細内容が不足していた。
・日本未承認だが米国・EUを含む世界60ヵ国以上で承認されているinclisiranに関しては、市販されていないと示唆した。
・「信頼できない」と評価された回答はなかった。

 研究者らは「この探索的研究では、一般的なオンラインAIモデルが単純なCVD予防の質問に対してほぼ適切な回答を提供することが明らかになった。調査結果は、一般的な CVD予防の質問に関する患者教育や患者と臨床医のコミュニケーションを強化することで、臨床ワークフローを支援するインタラクティブなAIになる可能性を示唆」とする一方で、今回評価したAIモデルは医療用ではないチャットボットの研究版である点に注意が必要であることも述べている。

(ケアネット 土井 舞子)