エムスリーテックブログ

エムスリー(m3)のエンジニア・開発メンバーによる技術ブログです

エムスリー機械学習ミニコンペを開催しました! #m3dev

こんにちわ。エムスリーのエンジニアまえはりん @maeharinです

先日エムスリーのAIチームメンバーが主催で機械学習のミニハッカソンを開催しましたので、その様子をレポします。場所はYahoo!JAPANのコワーキングスペース『LODGE(ロッジ)』

f:id:m3tech:20170915073204j:plain

お題はワインの品質当て!

お題は「ワインの要素(アルコール度数とかpHとか)とその品質(10段階のクオリティ)のデータを元に、品質を予測するモデルを作成してその精度を競おう」というもの

【課題】

  • ワインの品質を予測するモデルを作成しましょう。
  • モデルの精度はaccuracyを10 fold cross validationで評価。
  • データ・セットは次のURLからダウンロードできます!!
  • 赤ワインと白ワインのデータがあるが、赤ワインのデータを使う
  • 当日に着手してもいいですし、事前に準備しても構いません。AWS使ってもいいですよー。猫型のAIも利用可です。

この人が主催者。エムスリーのAIチームのエース(通称:インテリラガーマン)。今回の私の目標はこの人を倒すこと

f:id:m3tech:20170915073153j:plain

機械学習ニコンペ開始!

やり方は人それぞれ。python + scikit-learnで頑張る人や、TensorFlow使う人など様々

モデルの選択やパラメータチューニングをモクモク

私はwindows azure mlで勝負

windows azure mlならデータソースをアップロードして、GUI上でモデルや評価手法を選択してつなげていくだけなので楽ちん。データソースの概観をvisualizeすることもできるし(分散や散布図をサクッとみれる)

f:id:m3tech:20170915113809p:plain

モデルを変えて再実行したりも簡単。ローカルPCよりも実行時間は早そう。これなら機械学習初心者でも勝機があるかも!?

f:id:m3tech:20170915114049p:plain

スコアが上がったり下がったりの中盤戦

精度が出ないからってPCに念を送り出すI氏

f:id:m3tech:20170915073237j:plain

が、精度あがらず

f:id:m3tech:20170915073226j:plain

コンペ終盤、激しいデットヒート

チューニングを重ねていった私が暫定一位に!うほほほほ!

しかし、他のメンバーのサポートをしていたN氏(通称:インテリラガーマン)がものすごい勢いで追い上げてくる

結果発表

デッドヒートの結果は…

f:id:m3tech:20170915073249j:plain

私は2位!結局AIチームのエースを倒す目的は叶わなかったですが、機械学習初心者にしては上出来かな(^ω^)

ハッカソン後はリアルワイン品質品評会で締め!

f:id:m3tech:20170915073305j:plain

エムスリーではエンジニア仲間を募集しています!

エムスリーでは機械学習などのテクノロジーを活用して医療に貢献するエンジニアの仲間を募集中です!勉強会の見学やカジュアル面談も随時受け付けてますのでご興味があれば是非ご応募ください!