国が進める医療DX、診療や臨床研究の何を変える?~日本語医療特化型AI開発へ

提供元:ケアネット

印刷ボタン

公開日:2025/10/13

 

 内閣府主導の国家プロジェクト「戦略的イノベーション創造プログラム(SIP)」では、分散したリアルワールドデータの統合とデータに基づく医療システムの制御を目指し、日本語医療LLM(大規模言語モデル)や臨床情報プラットフォームの構築、患者・医療機関支援ソリューションの開発などを行っており、一部はすでに社会実装が始まっている。2025年9月3日、メディア勉強会が開催され、同プログラム全体のディレクターを務める永井 良三氏(自治医科大学)のほか、疾患リスク予測サービスの開発および受診支援・電子カルテ機能補助システムの開発を目指すグループの代表を務める鈴木 亨氏(東京大学医科学研究所)・佐藤 寿彦氏(株式会社プレシジョン)が講演した。

厚労省主導の医療DXとの関係、プログラムの全体像

 厚生労働省主導の医療DXが、診療行為に必要最低限の3文書(健康診断結果報告書、診療情報提供書、退院時サマリー)6情報(傷病名、感染症、薬剤アレルギーなど、その他アレルギーなど、検査、処方)に絞って広く全国規模で収集・利活用(全国医療情報プラットフォームの創設、電子カルテ情報の標準化、診療報酬改定DX)を目指すものであるのに対し、本プログラムではデータ取得対象は限定されるものの電子カルテデータに加えPHR、介護データ、医療レセプトや予後データなど含めたデータを収集し、臨床情報プラットフォーム構築や医療機関支援ソリューションの開発などを行うことを目的としている。2つのプロジェクトは、将来的には相互に連携していくことが期待される。

 具体的には、SIPでは大きく以下の5つの課題が設定されており、医療機関・大学・関連企業からそれぞれ研究開発責任者が選任されている1)

課題A:研究開発支援・知識発見ソリューションの開発(臨床情報プラットフォーム構築と拠点形成、PHRによる突然死防止・見守りサービス開発など)
課題B:患者・医療機関支援ソリューションの開発(受診支援・電子カルテ機能補助システムの開発、症例報告・病歴要約支援システム開発を通じた臨床現場支援など)
課題C:地方自治体・医療介護政策支援ソリューションの開発
課題D:先進的医療情報システム基盤の開発(ベンダーやシステムの垣根を超えた医療情報収集、僻地診療支援のためのクラウド型標準電子カルテサービスの開発など)
課題E:大容量リアルタイム医療データ解析基盤技術の開発(大規模医療文書・画像の高精度解析基盤技術の開発)

 同プログラムは2023年からの5年計画で進められており、可能なものから随時社会実装を進めつつ、今後は医療データプラットフォームの中核的病院への導入などを目指している。

医療テキスト800億トークンを学習させた日本語医療LLMを構築

 さらに令和5年度補正予算により生成AIの活用プロジェクトが開始され、日本語医療LLMの開発が進み、上記の各プロジェクトにおける応用が始まっている。現在世界中で使われている主なLLMでは、たとえばOpenAIのGPT-3の学習に使われた言語として日本語は0.11%に過ぎず、これらのLLMをベースに医療LLMを構築・利用した場合、

・診断を行うLLMにおいて、日本人の症例や日本の疫学ではなく、英語圏の症例や疫学がベースに出力される
・治療法を推奨するLLMにおいて、日本の医療/保険制度や法律に合わない出力がされる
といった問題が生じうる。また、データ主権の観点からも、現在各国で政府主導の自国語LLM開発が進んでいる背景がある。

 国立情報学研究所の相澤 彰子氏らは、さまざまな実臨床での利用に展開するためのベースモデルとして、医療テキスト800億トークンを学習させた日本語医療LLMのプレビュー版をすでに構築、医師国家試験で77~78%のスコア(注釈:尤度ベースと呼ばれる正解の算出方法に基づく)を達成した。開発したモデルは、推論時に利用するパラメータ数が220億と比較的軽量であるにも関わらず、700億クラスの海外モデルに匹敵する性能を示した。

 この医療LLMはSIPの各プロジェクトへの組み入れが始まっており、診療現場の会話からカルテを下書きし鑑別疾患を提示するシステムや、感染症発生届の下書き支援システムなどの開発が行われている。また、計算機科学者と医師がタッグを組む形で、循環器用医療LLM、がん病変CT画像用医療LLM、健診支援医療LLMの開発がそれぞれ進められているという。

電子カルテを活用した臨床情報プラットフォームや診断困難例サーチシステムがすでに始動

 電子カルテには、診療録、検査データ、手術レポートなどの多くの情報が集積しているが、それらを匿名化・統合した状態で臨床研究に活用するには人的・時間的に大きな負担がかかっていた。SIPの課題A1として取り組まれている「臨床情報プラットフォーム構築による知識発見拠点形成」では、CLIDAS研究2)と称して多施設から複数のモダリティの診療データを標準化・収集するシステムを構築。国内11大学・2ナショナルセンターの電子カルテはすでに統一・連携されている。循環器領域では、PCI後のスタチン強度と予後の関係について3)など、CLIDASデータを用いた研究成果がすでに発表、論文化されているものもあり、今後も本データの臨床研究への活発な活用が期待される。

 鈴木氏が責任者を務める課題A-3「臨床情報プラットフォームと連携したPHRによるライフレコードデジタルツイン開発」グループでは、NTTグループ約10万人の健診データ・約15年の追跡データを活用し、東京大学医科学研究所のスーパーコンピュータで疾患リスク予測モデルのアルゴリズム構築に着手。健診データを元に将来の疾患リスク(糖尿病・高血圧症・脂質異常症・心房細動)、検査や予防法の推奨などを提示する疾患リスク予測サービスの開発を行っている。将来的には、AIを用いた保健指導への展開も視野に開発中という。

 佐藤氏が責任者を務める課題B-2「電子問診票とPHRを用いた受診支援・電子カルテ機能補助システムの開発」グループでは、日本内科学会地方会のデータ化された症例報告(約2万5千例)を基に、鑑別診断の際に参考となる疾患や病態を検索できるシステム(診断困難例ケースサーチ J-CaseMap)をすでに社会実装済で、日本内科学会会員は無料で利用できる。そのほか、電子カルテと連携した知識支援チャットボット(富士通と連携)や、再診時電子問診票、医療特化AI音声認識システムが開発中となっている。

(ケアネット 遊佐 なつみ)