プライマリケアへの人工知能(AI)搭載聴診器の導入は心不全の検出率を増加させず、地域ベースの診断率の改善ももたらさないことが、英国・インペリアル・カレッジ・ロンドンのMihir A. Kelshiker氏らが行った「TRICORDER試験」において示された。心不全、心房細動、心臓弁膜症はいずれも頻度が高い疾患で、検出可能で治療も可能だが、緊急入院後に初めて診断される場合が多い。プライマリケアへの、AIに基づく安価で実用的な臨床現場(point-of-care)検出技術の導入は、これらの疾患の早期発見に結び付く可能性が示されていた。研究の成果は、Lancet誌オンライン版2026年1月28日号で報告された。
英国のプライマリケア施設のクラスター無作為化実装試験
TRICORDER試験は、2023年10月~2024年5月に、英国の205のプライマリケア施設で実施した非盲検クラスター無作為化対照比較実装試験(英国国立衛生研究所[NIHR]などの助成を受けた)。参加施設を、介入群(96施設、登録患者70万1,933例[平均年齢44.5歳、女性48.9%])または対照群(109施設、85万1,242例[43.5歳、47.9%])に無作為に割り付けた。
介入群の医師は、日常診療におけるAI聴診器使用の研修を受け、臨床導入した。対照群は通常診療を行った。介入の性質上、参加者(施設、臨床医、患者)の盲検化は不可能だった。
心音検査において、AI聴診器は15秒間の単一誘導心電図と心音図信号を記録した。これらのデータは3つのアルゴリズムに入力され、「左室駆出率低下(≦40%)」「心房細動」「弁膜症」の有無について、二値予測(陽性または陰性)の結果が返答された(いずれも規制当局の承認済み)。
主要エンドポイントは、新たに診断コードが付与されたあらゆる心不全(全サブタイプ)の発症率とし、英国国民保健サービス(NHS)のSecure Data Environmentから得たデータに基づき、1,000人年当たりの発症率(発症率比[IRR])として算出した。
心房細動、心臓弁膜症の検出にも差はない
介入群の施設では、972人の医療従事者がAI聴診器を用いて1万2,725例の検査データを記録した。平均追跡期間は、介入群が30.8(SD 10.8)週、対照群は35.8(SD 9.9)週だった。
ITT解析では、12ヵ月の時点における新規心不全は、介入群で1,342例(2.58/1,000人年)、対照群で1,984例(2.76/1,000人年)に発生し、検出率に関して両群間に有意な差を認めなかった(補正後IRR:0.94、95%信頼区間[CI]:0.86~1.02)。また、補正済み解析の結果、AI聴診器の導入に関連した地域ベースの検出への有意な転換はみられなかった。
心房細動(補正後IRR:0.98、95%CI:0.88~1.09)および心臓弁膜症(1.00、0.90~1.11)の検出についても、両群間に差はなかった。
一方、per-protocol解析(8,942例)では、新規心不全の検出率は介入群で有意に高く(補正後IRR:2.33、95%CI:1.28~4.26、p=0.0046)、心房細動(3.45、2.24~5.32、p=0.0013)、心臓弁膜症(1.92、1.09~3.40、p=0.020)の検出についても同様の結果であった。
AI技術は、導入されるシステムの実情から切り離せない
著者は、「AIの技術的性能は高いものの、疾患の検出率に有意な向上がみられなかったという結果は、臨床効果を実現するには、実装環境(とくに、診療の行程への統合や臨床医の受容性)が中心的な役割を担うことを示しており、AI技術の有効性が、それが導入されるシステムの実情から切り離せないことを強調している」「これらの知見は、重点を置くべき要件を、単に『アルゴリズムが機能すること』を証明する段階から、複雑で医療資源の限られた環境において持続的に利用するための文脈要因(contextual factor)を研究・最適化する段階へ転換するよう促すもの」と考察し、「医療システムにおいてAI技術を効果的に展開し、その後のインパクトを確実なものにするには、実用的な有効性研究と並行して実装科学(implementation science)を組み込んだ研究デザインが重要であることを、本試験は立証した」としている。
(医学ライター 菅野 守)