エムスリーテックブログ

エムスリー(m3)のエンジニア・開発メンバーによる技術ブログです

臨床AIはなにができ、何が難しいか: 臨床AI研究開発の3類型

こんにちは、エムスリーエンジニアリンググループ/AI・機械学習チームの大垣 (@Hi_king) です。

これは エムスリー Advent Calendar 2020 の14日目の記事です。 前日は id:juntaki による、Goのchannelとスケジューリングでした。

私達AI・機械学習チームの挑戦している課題としては、MLによるサービス体験の向上、MLを中心とする新規サービスなど諸々あるのですが、 今日は、なかでも、臨床現場で利用するためのAI開発について書いてみようと思います。

上記のスライドはこのテーマで45分ほど社内勉強会を行うために作ったもので、 このなかから、エッセンスをかいつまんでブログ記事にしてみました。 記事中で紹介しきれなかったそれぞれの研究などはスライドをあらためて眺めていただけると幸いです。

私自身は、もともとコンピュータビジョン分野が専門で、医療分野に本格的に関わり始めたのはここ1年ほどになります。 参入するに当たり、まず臨床に用いられるAIの研究・開発は、いまどのような分類があり、どのようなデータを収集して学習できるのか 、 という観点で、既存の研究をまとめる作業を行ったのがこの資料になります。

ということで、今回の記事は以下のような人向けです。

For

  • 臨床AIビジネスの攻めどころを考えている人
  • 臨床AIの研究・開発を始めたい人
  • ML周辺分野をやっている人で、医療分野での応用例をざっくり幅広く知りたい人

Not for

  • MLのアルゴリズム自体について知りたい人
  • 特定の課題についての、最も良い研究を知りたい人

臨床AIの開発ステップ・問題設定の重要性

f:id:Hi_king:20201213165305p:plain

臨床研究の考え方で整理すると、臨床AIの開発というのは

  • 後ろ向き*1に集めた、多くの入力と出力の対を利用してモデルを学習し
  • 前向き*2に新しい入力を入れて性能検証・臨床利用を行う

厳密には、特殊なデータは前向きでないと集められなかったり、大量の入力データだけから関係性を見つける教師なし学習の設定もありますが、一旦ここでは入力・出力対を学習する教師あり学習に絞って見ていきます。

図の通り、1)入・出力のデータを集める、2)モデルを学習する、3)利用するというプロセスがあるわけですが、 臨床AIの開発の成功を決めるのは、何を入れて、何を出すかの問題設定が、解決可能な難易度で、かつ意味のある問題設定にできるか、というところに尽きるように思います。

そこで、今回は、何を入力として、何を出力に設定したらどのような問題が解けるか、の整理を行っていきます。

3類型

f:id:Hi_king:20201213180741p:plain

早速ですが、臨床AIにおける入・出力のデータの種類を勝手に3種類に分けて整理することを試みます。

  1. 医師の診断を模倣する: 模倣型
  2. 検査値間の変換を行う: 変換型
  3. 未来の事実を予測する: 予測型

作ろうとしているAIがこれらの三類型のどこに当てはまるかで、データの収集方法と、できたAIの活用方法が大きく異なってきます。図中に示したように、それぞれが持つメリットと、一方で解決しなければいけない課題もあります。

1. 模倣型

f:id:Hi_king:20201214071247p:plain

模倣型は、臨床AIを考える時に一番最初に思いつくであろうわかりやすい問題設定となります。 入力としては医師が実際に診断に用いるようなデータ、出力は医師の診断結果です。 入力は、画像に限っても、マンモグラフィ 1、X線 2、眼底画像 3 など多岐にわたります。 なお、学習についてはそれらに特化したモデルではなく、一般的なコンピュータビジョンのモデルを利用することが多く、同じような方法で様々な問題が解けることも、この類型のわかりやすさと言えます。

良いところ

  • 素直な問題設定で、出力もわかりやすい
  • 人間の医師との比較で性能検証もしやすい

医師の診断結果との一致率を計測することで、直感的な性能の検証ができます。 医師同士の一致率と同程度になるか、というような検証もできます。

課題

  • 本来医師が行うべき診断を模倣するものなので、既存のワークフローに入れにくい
  • AIを考えて真っ先に思いつく利用先なので当然競合が多い

ただAIが診断を行うという考え方ではなく、普段専門医が見ないようなかなり早期の患者で早期診断を行う、医療安全の観点で見落としを防ぐために医師と独立にチェックする、というような、既存のフローの改善になる利用方法を考える必要があります。

2. 変換型

f:id:Hi_king:20201214074816p:plain

模倣パターンと違い、基本的に人間の判断を正解とするのではなく、同じ患者に対する2通りの違うデータ(検査値)を用意し、それらの間の変換の関係性を学習します。 特に、三類型のなかで、出力が医用画像など検査値にできることに特徴があります。 変換と一口に言っても、直感的なものだけでなく、割と意外な組み合わせでもうまく学習できることがあります。

非常に興味深い応用として、学習時に同一の患者に対するMRIとCTの両方のデータが有った場合に、MRIの撮影だけでCT画像を予測できる 4、 病理組織の染色前後の画像で学習し、染色作業なしにバーチャル染色を実現する 5 などの研究があります。 また、更に変換対のデータが得やすい例としては、短時間で撮影したノイジーなMRI画像から高解像度化を行うというAIの開発があげられます。 MRI画像を撮影する際に、高解像度(低ノイズ)の最終画像に加えて、短い時間の途中経過データも得ることができるので、この変換対を学習すればよい、というものです。

良いところ

  • 既存の医療機器や検査を置き換えるものになりやすく、市場もわかりやすい
  • あくまでも変換なので、人間が解釈できる

やはり出力に特徴がある類型であり、出力値を医師がそのまま利用できる、解釈しやすいものであるという大きな強みがあります。 また、簡便な検査の結果を、高精度な検査の結果に変換する、など、価値もわかりやすいと思います。

課題

  • 模倣に比べると、いい問題を見つけるのが難しい
  • 変換後の出力がうまく近似できていることの性能の評価方法が難しい、定性的な評価になってしまう

3. 予測型

f:id:Hi_king:20201214082330p:plain

最後に"予測"と分類したものについてです。こちらも変換と同様に、人間の判断が(あまり)入らない入出力で学習できるところに強みがあります。 入力は検査値、出力は(検査時点では)未来の”事実”、検査時点では未来であっても、過去に向かって後ろ向きにデータ収集することはできるので、将来のリスクを予測できるモデルを作るものです。

リスク予測のわかりやすい例としては、どのような疾患かによらず一定期間に胸部X線を撮影されたすべての患者について12年後生存していたかという予測問題を解く話 6 だったり、病理画像を元にその後の薬剤治療が有効かどうかを予測する話 7 があります。 また、未来の予測というには少し期間が短くはあるのですが、術後に組織画像から判明する良性・悪性を、術前の血液マーカーなどから高精度に予測するという問題 8 も臨床AIに求められている予測能力と言えます。

良いところ

  • 複雑な要因を扱えるため、人間の気づいていない条件にも気づける

ある種患者の状態を判断するという点で模倣にも近いものではあるのですが、現在の人間の能力に縛られないために、よくAIに求められがちな、"人間にはできないことができる"部分に挑戦できる可能性があります。

課題

  • 予測それだけでは医師が結果を解釈できない。5年生存と言われても判断根拠がわからない

一方で、もしかなり正確に未来のリスク予測ができたとして、予測そのものだけでは医療行為には直接繋がりません。 もし投薬をしたら・手術をしたら、の場合の予後を予測するなど、具体的なアクションに繋がる問題設計をしないと、実際に臨床現場に価値を生むものになりにくいと思われます。

応用的な話

この記事中では省きましたが、三類型の研究以外に、以下の二分野の研究についてもいくつかおまけ的にスライド中で紹介してあります。

画像以外の入力データについて

もちろん臨床AIの研究は画像ばかりではなく、電子カルテなどの自然言語データ、ウェアラブルセンサなどの時系列データなども大きな分野です。

教師なし学習について

ここまで、入・出力の対応がついている教師あり学習についてのみ扱って来ましたが、入力として大量のCT画像・大量の病理画像だけがある時にそれらの"類似度"尺度を学習するという考え方もあります 9。 ラベルなしデータでも大量にあれば利用価値が生まれるという点で大きなメリットが有るのですが、教師あり学習とは使い所が大きく異なって来るために省きました。

まとめ

もっともシンプルな模倣の話から始めて、臨床AIの研究動向について三類型に分類しながら紹介させていただきました。

現状の臨床AIは、やはり問題発見しやすく、結果の解釈もしやすい診断AIの話が注目されることが多いです。 しかし市場が成熟していくにつれ、よりAIのほうが得意で、人間の判断にも影響されにくい、変換・予測の注目度が上がっていくと私は考えています。

エムスリーでも、(早期)診断・発見AIはもちろん10 、予後の予測 11 というところでも現在挑戦を進めています!

[PR] We are hiring!

医用画像処理を中心とする診断・治療向けの開発は、解けるかどうかがわかっていない問題も多く、チャレンジングでとても楽しいです。 また、最初にも書きましたが、MLによるサービス体験の向上、MLを中心とする新規サービスに関わりたい人もぜひ、ということで、機械学習エンジニアの採用リンクをはらせていただきます。まずはカジュアル面談からでも、お待ちしてます!

open.talentio.com

jobs.m3.com

リンク・参考文献


  1. McKinney, Scott Mayer, et al. “International evaluation of an AI system for breast cancer screening.” Nature 577.7788 (2020): 89-94.

  2. Xue, Yanping, et al. “A preliminary examination of the diagnostic value of deep learning in hip osteoarthritis.” PLoS One 12.6 (2017): e0178992.

  3. An, Guangzhou, et al. “Glaucoma diagnosis with machine learning based on optical coherence tomography and color fundus images.” Journal of healthcare engineering 2019 (2019).

  4. Nie, Dong, et al. “Medical image synthesis with context-aware generative adversarial networks.” International Conference on Medical Image Computing and Computer-Assisted Intervention. Springer, Cham, 2017.

  5. Rivenson, Yair, et al. “Virtual histological staining of unlabelled tissue-autofluorescence images via deep learning.” Nature biomedical engineering 3.6 (2019): 466.

  6. Lu, Michael T., et al. “Deep learning to assess long-term mortality from chest radiographs.” JAMA network open 2.7 (2019): e197416-e197416.

  7. Johannet, Paul, et al. “Using machine learning algorithms to predict response and toxicity to immune checkpoint inhibitors (ICIs) in melanoma patients.” (2019): 2581-2581.

  8. Kawakami, Eiryo, et al. “Application of artificial intelligence for preoperative diagnostic and prognostic prediction in epithelial ovarian cancer based on blood biomarkers.” Clinical Cancer Research 25.10 (2019): 3006-3015.

  9. Hegde, Narayan, et al. “Similar image search for histopathology: SMILY.” NPJ digital medicine 2.1 (2019): 1-9.

  10. https://corporate.m3.com/assets.ctfassets.net/1pwj74siywcy/7HHFHVE4PYuZC8uGW5RNP5/aa416addf7ad049777db12c2a7a55402/201208_J_m3_NBI_ILD_AI_Collaboration_Public.pdf

  11. https://corporate.m3.com/press_release/2020/20200930_001637.html

*1:臨床研究の用語で、過去のデータにさかのぼって行う研究

*2:臨床研究の用語で、将来どうなるかを追跡して観察する研究