軽度認知障害(MCI)では、発声パターンやテンポの変化がみられることがあるため、音声は認知機能障害の潜在的なバイオマーカーとなる可能性がある。音声バイオマーカーの予測特性をタイムリーかつ非侵襲的に検出するうえで、人工知能(AI)を用いたMCIの検出は、費用対効果に優れる方法であると考えられる。国立循環器病研究センターの清重 映里氏らは、日本の地域住民における非構造的な会話の音声データからAIで生成した音声バイオマーカーを用いて、MCIを検出する予測モデルを開発し、その効果を検証した。The Lancet Regional Health. Western Pacific誌2025年6月12日号の報告。
日本の地域在住成人1,461人を対象に横断的デザインによる観察研究を実施した。アウトカムは、MCIスクリーニングの記憶パフォーマンス指数スコアにより評価した認知機能障害とした。音声データは、3分間の自由解答式インタビューより収集し、音声生成器Wav2Vec2を用いて、音響的特徴と韻律的特徴に基づき、512次元の個々の音声情報ベクトルとして音声バイオマーカーを抽出した。その他の重要な予測因子として、年齢、性別、教育歴を含めた。979人の参加者を対象に、極度勾配ブースティング決定木アルゴリズムとディープニューラルネットワークモデルを適用し、認知障害予測モデルを開発した。モデル開発に含まれなかった482人の参加者において、曲線下面積(AUC)を用いて予測性能を検証した。
主な結果は以下のとおり。
・対象者の内訳は、女性が967人(66.2%)であり、認知障害が526人(36.0%)でみられた。
・平均年齢は79.5±6.3歳、平均教育年数は11.6±2.2年であった。
・音声バイオマーカーの導入により、年齢・性別モデルでは、AUCが0.80(95%信頼区間[CI]:0.76〜0.84)から0.88(0.84〜0.91)へ有意な改善が認められた(DeLong検定:p<0.0001)。
・また、年齢・性別・教育モデルでは、AUCが0.78(95%CI:0.73〜0.82)から0.89(0.86〜0.92)へ有意な改善が認められた(DeLong検定:p<0.0001)。
著者らは「音声バイオマーカーを用いた認知障害の予測モデルは、MCIスクリーニングにかかる時間を大幅に短縮し、高い予測性能示すことが明らかとなった。音声バイオマーカーは、予測性能の向上に大きく貢献することが示唆された」とまとめている。
(鷹野 敦夫)