こんにちは、AI・機械学習チームの浮田 (id:uKita) です。

今年のMultinational Association of Supportive Care in Cancer (MASCC)という国際学会にて、私たちのチームがサポートしてきた研究開発がオーラル発表されたので、今回はその内容について紹介します。発表のアブストラクトはこちらです。

臨床AIの開発
今回の研究の背景
データセット
解析
- データ量があまり多くないことへの対処
- 画像の前処理
結果
- データ量と精度の関係
まとめ
We're hiring!

臨床AIの開発

AI・機械学習チームでは、臨床現場で活用できるAIの開発に取り組んでいます。これまで、間質性肺炎の診断AIやCOVID-19肺炎の重症化を予測するAIをはじめ、様々な疾患や症状を対象にモデルを開発してきました。これらの事例の詳細はこちらです。

www.m3tech.blog

corporate.m3.com

今回は、このような胸部X線やCT画像とは異なり、患者さんの足の画像からその患者さんが将来副作用を発症するかどうかの予測に取り組みました。

今回の研究の背景

一部の抗がん剤の副作用として、手足症候群と呼ばれる皮膚症状があります。この副作用はその名の通り、手や足にしびれや痛み、腫れなどが起きてしまう症状です。手足症候群には確実な治療法がないため、なるべく発症前から予防措置（軟膏の外用など）を取ることが重要になります。しかし、個々の患者さんが手足症候群を発症しやすいかどうかを、発症前に予見できない上に、全患者さんに徹底的に予防措置を行うのは難しい現状です。

そこで今回、抗がん剤の投与前の患者さんの状況から、将来その患者さんが手足症候群*1を発症しやすいかを機械学習で予測することを試みました。このタスクのユニークな点としては以下の2点です。

医療画像の分野ではX線やCTなどの放射線画像が一般的ですが、今回は足の皮膚画像という珍しいデータを用いている点
患者さんの現在の状態の診断（画像診断など）ではなく、将来の状態を予測している点

データセット

虎の門病院臨床腫瘍科の過去約7年間の診療記録から、76名の患者さんのデータを使用しました。各患者さんにつき、以下の情報を収集しました。

抗がん剤投与開始時の背景情報：身長、日常の活動量など
抗がん剤投与開始時の足裏の写真*2
抗がん剤投与後に、手足症候群を発症したかどうか

手足症候群を起こす抗がん剤は全体の中の一部であり、後ろ向きに集めたデータであることから写真や臨床データの欠失も存在し、7年間の診療記録から集めても76名というデータ量になっています。

解析

モデルの概要は図の通りです。

1) 足裏画像から手足症候群の有無を予測するモデル

2) 背景情報から手足症候群の有無を予測するモデル

の2つを学習させた後に、

3) 1)と2)の出力をアンサンブルするモデル

を作成し、3) の出力を最終的な出力としました。画像情報と非画像情報のアンサンブルの際にこのようなlate fusionを用いたのは、入力が1) 画像だけの時、2) 背景情報だけの時、3) アンサンブルした時の精度を簡単に比較できるためです。

1) の画像モデルにはResNet50を、2) の背景情報モデルにはXGBoostを用い、これらの学習・評価は4-fold stratified cross validationで行いました。さらに、3) のアンサンブルは1) と2) の単純平均を取るだけの処理としました。

特に1) 画像モデルにおいて、以下の工夫を行いました。

データ量があまり多くないことへの対処

データ量があまり多くないため、以下の工夫を行っています。

ImageNetでの事前学習
様々なdata augmentation (flip, rotation, color jitter, random gammaなど) を導入
学習を異なるランダムシードで5回行い、それらのアンサンブルを行う

画像の前処理

入力は足裏の画像ですが、背景に足裏以外の物が映り込んでいる画像が見受けられました。そこで、背景除去として様々な手法を試した結果、大津の二値化が主観的に綺麗に背景を除去できたことから、大津の二値化で画像の前処理をしました。

結果

結果は図の通りで、1) 画像モデル、2) 背景情報モデル、3) アンサンブルモデルそれぞれのROC-AUCはそれぞれ0.550, 0.693, 0.699となりました。

データ量と精度の関係

今回、データ量が多くなかったことから、データ量と精度の関係を追加で考察しました。今回収集したデータ量のm% (0 < m <= 100) を使って同様に求めた精度をF(m) とし、もしF(m) がm (0 < m <= 100) に対して単調増加しているなら、mとF(m)の関係を外挿して考えると、データ量を今後増やすことで精度が改善できる可能性が示唆されます。一方、m <= 100の範囲でF(m)が既にサチュレーションしているなら、データ量を増やしても精度の改善があまり期待できません。

このような解析の結果、1) 画像モデル、2) 背景情報モデルいずれにおいても、精度F(m)がデータ量mに対して単調増加しており、今後データ量を増やすことで精度が改善できる可能性が示唆されました。特に1) 画像モデルの方がより増加傾向にあったことから、今回低かった1) 画像モデルの精度は、データ量を増やすことで更に改善できると推測されました*3。

まとめ

このように、手足症候群の発症を治療開始前から予測するモデルを作成しました。予測精度はAUC 0.7という結果でした。

医療AIにおいて、患者さんの現在の状態を診断する研究開発は、病気の画像診断のようにたくさん行われているものの、将来の状態を予測する研究開発はまだ多くありません。このような将来予測の場合、予測に必要な情報がモデルの入力に入っている保証もなく、画像診断などと比べるとどうしても精度は低くなりがちですし、実際、画像診断とは異なり人間（医師）でもできないタスクの場合も多いです。今回の精度がAUCで0.7とあまり高くはならなかった理由には、そのようなタスク本来の難しさと、データ量のために特にCNNの学習が難しかったことなどが考えられます。

今後精度を向上させるには、データ量だけでなく、背景情報として収集した項目の見直しも重要と考えられます。例えば、抗がん剤治療中に手足症候群の予防ケアをどの程度行ったかなどは、今回モデルの入力に入っていませんが重要な特徴量と考えられます。そのような項目も収集できれば精度が改善できるかもしれません。

将来このような副作用予測のAIが実用化されると、どの患者さんに副作用が発生しやすいかを定量化でき、リスクが高い患者さんには集中的に予防ケアを行うなど、個別化医療につながると考えられます。

最後に、共同研究者である虎の門病院臨床腫瘍科の方々には、データのご提供、ディスカッションなど様々な場面でお世話になりました。虎の門病院臨床腫瘍科は手足症候群のケアに長年取り組んできたため、10年近く前から患者さんの画像や記録が蓄積されており、かなり貴重で珍しいデータを扱うことができました。

We're hiring!

AI・機械学習チームでは、医療画像をはじめ様々な問題に機械学習を用いて取り組んでいます。興味を持った方は、以下のリンクからご応募お待ちしています！インターンも通年募集中です！

jobs.m3.com

*1:正確には、Grade 2以上の手足症候群。手足口病ではないです

*2:本来手と足に発症する病気ですが、今回は足の画像のみ使用しています

*3:画像モデルではCNNを用いており、より多くのデータ量が必要というのはよくある話かと思いますが

エムスリーテックブログ

エムスリー(m3)のエンジニア・開発メンバーによる技術ブログです

抗がん剤の副作用をAIで予測する