Apple Watchで心不全の悪化を予測できる?
2026年Nature論文を読んでみた
スマートウォッチが心肺機能の低下を検知し、入院を中央値7.4日前に予測 ─ TRUE-HF研究
論文の概要
2026年にNature Medicineに掲載された、Apple Watchのデータから心不全患者のヘルスケアデータを毎日推定し、悪化の兆候を早期に検知するという画期的な論文を読んでみました。心不全は安定期と増悪期を繰り返す病気ですが、従来の検査は月に1回程度の「スナップショット」でしかありません。この研究は、患者さんが普段の生活で着けているスマートウォッチのデータから、病院で行う高度な運動負荷試験(CPET)に匹敵する評価を毎日行えることを示しました。
出典:Gao Y, Moayedi Y, et al. Remote monitoring of heart failure exacerbations using a smartwatch. Nature Medicine. 2026;32:924-933. (TRUE-HF研究; NCT05008692)
なぜこの研究が重要なの?
心不全は世界で約6,000万人が罹患する深刻な病気で、年間の医療費は約346億ドル(約5兆円)にのぼります。女性の生存期間中央値は3.2年、男性は1.7年と予後も厳しい疾患です。入退院を繰り返すことが多いのですが、現在の医療では「悪化しそうなサイン」を日々キャッチする良い方法がありませんでした。
🏥 従来の評価法の限界
- CPET(心肺運動負荷試験):最も正確だが高額・大型装置が必要で、日常的に繰り返すのは不可能
- 6分間歩行試験:監視なしでの精度が不確実
- NYHA分類:主観的で、患者の日々の変動を反映できない
- NT-proBNP:採血が必要で、リアルタイムの変化は追えない
⌚ ウェアラブルの可能性
- Apple Watchは心拍数・歩数・活動量・酸素飽和度などを24時間自動記録
- 患者の負担がほぼゼロ(着けているだけでOK)
- 遠隔モニタリングにより入院を最大15%削減できた先行研究も
- しかし心不全患者での検証は十分でなかった
研究デザイン
👥 対象患者
- カナダ・トロント大学の心臓センターに通院する心不全患者
- 合計217人が登録(女性70人、男性147人)
- 年齢中央値:57.0歳
- 82.5%が駆出率低下型心不全(HFrEF)
- 77%以上がNYHAクラスII以上
- 人種構成:白人61%、アジア人20%、黒人12%、その他7%
📋 方法
- Apple Watch Series 6を約3か月間(中央値94.5日)装着
- 開始時と終了時に院内でCPET・6分間歩行試験・採血を実施
- 日々のデータをHealthKit経由で自動収集
- 予定外の入院・緊急外来受診・点滴利尿薬使用を追跡
- 154人で学習、63人で性能を検証(テストセット)
ポイント:通常の生活をそのまま送ってもらい(「もっと歩いてください」などの指示なし)、Apple Watchが自動で集めるデータだけを使って心肺体力を推定するという点がユニーク。研究者側はテストセットの63人を最後まで一切触れず、モデル改良の繰り返しによる評価の偏り(テストセットへの情報漏洩)を徹底的に防いでいます。
TRUE-HFモデルの仕組み
この研究の核心は「TRUE-HF」と名づけられた深層学習モデルです。30日間分のウェアラブルデータを読み込み、翌日の心肺体力(pVO₂)を毎日予測します。
⌚
Step 1:Apple Watchが心拍数・歩数・活動エネルギー・酸素飽和度など9種類のデータを90分間隔で自動記録
↓
🧹
Step 2:異常値を除去し、90分ごとの統計量(平均・中央値・最小・最大・標準偏差)に集約
↓
🧠
Step 3:トランスフォーマー(大規模言語モデルと同じ技術)が、90分→3時間→6時間→12時間→1日と段階的に時間スケールを広げながら30日分の傾向を学習
↓
👤
Step 4:年齢・性別・体重・服薬情報などの臨床データも統合(FiLM条件付けという手法)
↓
📈
出力:その日のpVO₂(最大酸素摂取量)を予測。10%以上の低下が「危険サイン」
たとえるなら:火曜日の運動が木曜日の体調にどう影響するか、先週全体の傾向が今日に何を意味するか——こうした「時間のつながり」を理解できるのがTRUE-HFモデルの強みです。従来のAIモデルは各時点を独立に扱うため、こうした長期的な文脈を捉えられませんでした。
主な結果
🎯 心肺機能の予測精度
r = 0.85
TRUE-HFモデルの予測と実際のCPET測定値の相関(ピアソン相関係数)
誤差 0.25 L/min
平均絶対誤差。これはCPETの再現性(テスト-再テスト信頼区間)の範囲内
AUROC 0.82
pVO₂の10%以上の低下を検出する精度(Apple独自アルゴリズムは0.52)
わかりやすく言うと:TRUE-HFモデルは、病院の運動負荷試験で測る心肺体力を、自宅にいながらApple Watchのデータだけで高精度に推定できました。Apple Watch標準の心肺体力推定機能(VO₂max)と比較すると、圧倒的に優れた精度です。特に重症の患者さんではAppleの既存アルゴリズムは「運動量が少なすぎて測定不能」となることが多かったのに対し、TRUE-HFモデルは全員に毎日予測値を出せました。
🚨 予定外入院の予測
HR 3.62
pVO₂が10%低下するごとのハザード比(95%CI: 1.37-9.55, P < 0.01)
7.4日前
予定外医療イベントに先行してpVO₂低下を検知した中央値日数
感度 88%
10%低下をしきい値とした場合の感度(特異度62%)
わかりやすく言うと:Apple Watchで推定した心肺体力が10%下がった患者さんは、入院や緊急受診のリスクが約3.6倍に跳ね上がりました。しかもその低下は、実際のイベントの約1週間前に現れており、「早期警報システム」として機能する可能性を示しています。従来の血液検査(NT-proBNP)やNYHA分類など、一時点の検査ではこの予測は達成できませんでした。
従来の指標との比較
| 予測指標 |
ハザード比 |
P値 |
判定 |
| TRUE-HF 日次pVO₂(連続変量) |
3.62(1.37-9.55) |
0.009 |
✅ 有意 |
| CPET pVO₂(ベースライン) |
1.37(0.33-5.72) |
0.664 |
❌ |
| NT-proBNP(ベースライン) |
0.86(0.52-1.42) |
0.559 |
❌ |
| 6分間歩行距離(ベースライン) |
1.00(0.99-1.01) |
0.800 |
❌ |
| NYHA分類(ベースライン) |
0.88(0.32-2.38) |
0.795 |
❌ |
| SHFMスコア |
1.12(0.41-3.02) |
0.830 |
❌ |
| MAGGICスコア |
1.06(0.96-1.17) |
0.260 |
❌ |
注目ポイント:従来の臨床指標(血液検査値、CPET結果、機能分類、リスクスコア)はいずれも「ある一時点のスナップショット」にすぎません。TRUE-HFモデルだけが唯一、予定外医療イベントと有意な関連を示しました。日々のデータを追い続ける「動画」と、診察時に1枚撮る「写真」の違いです。
外部検証:All of Usコホート
TRUE-HFモデルの汎用性を確認するため、米国NIHの「All of Us」研究プログラムから193人の心不全患者データ(Fitbit使用)を用いて外部検証が行われました。使えるセンサーが心拍数と歩数のみという厳しい条件でした。
📊 外部検証の結果
- pVO₂が10%低下するごとのハザード比:1.32(95%CI: 1.03-1.69, P = 0.03)
- イベント発生の中央値21日前に低下を検知
- 感度50%、特異度59%(センサー制限下)
- 人種構成が異なる集団でも方向性は一致
🔬 知識蒸留による転移
- Fitbitでは9種中2種のデータしか取得できない
- フルモデル→中間モデル→軽量モデルという「教師-助手-生徒」方式で知識を移転
- 効果は弱まるものの、統計的に有意な予測力を維持
- Apple Watch以外の機器でも応用可能な道筋を提示
収集されたデータ量
217人の患者さんから約3か月間で、合計1億4500万件以上のHealthKit記録が収集されました。
| データの種類 |
記録件数 |
| ActiveEnergyBurned(活動消費カロリー) |
6,073万件 |
| BasalEnergyBurned(基礎代謝カロリー) |
3,677万件 |
| HeartRate(心拍数) |
2,986万件 |
| Distance(移動距離) |
814万件 |
| StepCount(歩数) |
514万件 |
| AppleStandPlusTime(立ち上がり時間) |
261万件 |
| AppleExerciseTime(運動時間) |
138万件 |
| OxygenSaturation(血中酸素飽和度) |
66万件 |
| HeartRateVariabilitySDNN(心拍変動) |
37万件 |
ここがポイント
✅ この研究の強み
- 市販のスマートウォッチだけで高精度な心肺体力推定を実現
- 「毎日の変化の傾向」を捉える初のアプローチ
- 予定外入院を約1週間前に検知できる可能性
- 独立した外部コホート(異なるデバイス・国・人種)で再現
- 患者の負担がほぼゼロ(追加の運動指示なし)
- テストセットを完全に分離し、評価バイアス(テストセットへの過適応)を防止
- 白人・非白人間でモデル精度に差がないことを確認
⚠️ 注意点・限界
- テストセットが63人と小規模で、イベント数が少ない
- 駆出率保持型心不全(HFpEF)の患者がテストセットに6人のみ
- 観察研究であり、この検知が治療介入に結びつくかは未検証
- 完全な多変量調整は検出力不足のため実施できず
- Apple提供のデバイスを使用し、著者らは特許出願中
- モデルの重みは非公開(プライバシー上の理由)
この研究はApple Watchデータから「心肺機能の低下」を検知できることを示しましたが、「検知した結果、早期介入によって入院が減るか」という介入試験はまだ行われていません。今後のランダム化比較試験による検証が待たれます。
結論
TRUE-HF研究は、Apple Watchのデータと深層学習モデルを組み合わせることで、心不全患者の心肺機能を日々モニタリングし、悪化の兆候を早期に検知できる可能性を初めて本格的に示しました。従来の静的な検査では捉えられなかった「体力の下り坂」を、約1週間前にキャッチできるという発見は、心不全管理に新しい地平を切り開くものです。
💡 私たちの生活にどう活かす?
心不全をお持ちの方やそのご家族にとって、この研究が伝える最も重要なメッセージは「日々の小さな変化の積み重ねに意味がある」ということです。現時点ではTRUE-HFモデルはまだ研究段階であり、一般の患者さんが使えるアプリにはなっていません。しかし、Apple Watchで日々の活動量や心拍数の傾向を意識しておくことは、「いつもと違う」変化に早く気づく助けになるかもしれません。体力の低下を感じたら、自己判断せず早めに主治医に相談することが大切です。
スマートウォッチのデータは医療機器の診断に代わるものではありません。心不全の管理や治療については、必ず主治医にご相談ください。
おすすめ製品