こんにちわ。エムスリーのエンジニアまえはりん @maeharinです
先日エムスリーのAIチームメンバーが主催で機械学習のミニハッカソンを開催しましたので、その様子をレポします。場所はYahoo!JAPANのコワーキングスペース『LODGE(ロッジ)』
お題はワインの品質当て!
お題は「ワインの要素(アルコール度数とかpHとか)とその品質(10段階のクオリティ)のデータを元に、品質を予測するモデルを作成してその精度を競おう」というもの
【課題】
- ワインの品質を予測するモデルを作成しましょう。
- モデルの精度はaccuracyを10 fold cross validationで評価。
- データ・セットは次のURLからダウンロードできます!!
- 赤ワインと白ワインのデータがあるが、赤ワインのデータを使う
- 当日に着手してもいいですし、事前に準備しても構いません。AWS使ってもいいですよー。猫型のAIも利用可です。
この人が主催者。エムスリーのAIチームのエース(通称:インテリラガーマン)。今回の私の目標はこの人を倒すこと
機械学習ミニコンペ開始!
#m3dev はじまた pic.twitter.com/Zm0539adBL
— まえはりん (@maeharin) 2017年9月9日
優勝したら飲み会がタダ!! #m3dev
— nishiba (@m_nishiba) 2017年9月9日
やり方は人それぞれ。python + scikit-learnで頑張る人や、TensorFlow使う人など様々
clf.score(X_test, y_test)
— sohatach (@sohatach) 2017年9月9日
0.31808941769195298
恐ろしく低い結果。。#m3dev
モデルの選択やパラメータチューニングをモクモク
xgboostの結果をlogistic regressionに入れています。 #m3dev
— nishiba (@m_nishiba) 2017年9月9日
私はwindows azure mlで勝負
#m3dev 僕はazure mlでやっとる pic.twitter.com/U2KjLNX1f2
— まえはりん (@maeharin) 2017年9月9日
windows azure mlならデータソースをアップロードして、GUI上でモデルや評価手法を選択してつなげていくだけなので楽ちん。データソースの概観をvisualizeすることもできるし(分散や散布図をサクッとみれる)
モデルを変えて再実行したりも簡単。ローカルPCよりも実行時間は早そう。これなら機械学習初心者でも勝機があるかも!?
スコアが上がったり下がったりの中盤戦
#m3dev Overall accuracy0.600375 うーん。。。
— まえはりん (@maeharin) 2017年9月9日
SVM 0.601615566038
— sohatach (@sohatach) 2017年9月9日
までいきました。#m3dev
精度が出ないからってPCに念を送り出すI氏
が、精度あがらず
コンペ終盤、激しいデットヒート
チューニングを重ねていった私が暫定一位に!うほほほほ!
#m3dev Overall accuracy0.704816 pic.twitter.com/P05oXcxNYI
— まえはりん (@maeharin) 2017年9月9日
しかし、他のメンバーのサポートをしていたN氏(通称:インテリラガーマン)がものすごい勢いで追い上げてくる
更新!! 0.6998 #m3dev
— nishiba (@m_nishiba) 2017年9月9日
#m3dev やばい、インテリラガーマンが追い上げてくる(;^ω^)
— まえはりん (@maeharin) 2017年9月9日
#m3dev ヤバイヤバイヤバイ...チューニングの手が全く思いつかない(;^ω^)
— まえはりん (@maeharin) 2017年9月9日
更新!! 0.7079 #m3dev
— nishiba (@m_nishiba) 2017年9月9日
#m3dev 0.707317 ちょっと上がった
— まえはりん (@maeharin) 2017年9月9日
全然だめです。0.595997498437
— jx (@jx_) 2017年9月9日
#m3dev
#m3dev 0.707942
— まえはりん (@maeharin) 2017年9月9日
追いついた!!!
結果発表
デッドヒートの結果は…
順位発表!
— nishiba (@m_nishiba) 2017年9月9日
1位 nishiba
2位 maehara
3位 watanabe
4位 omoto
いえ~い!!#m3dev
私は2位!結局AIチームのエースを倒す目的は叶わなかったですが、機械学習初心者にしては上出来かな(^ω^)
ハッカソン後はリアルワイン品質品評会で締め!
エムスリーではエンジニア仲間を募集しています!
エムスリーでは機械学習などのテクノロジーを活用して医療に貢献するエンジニアの仲間を募集中です!勉強会の見学やカジュアル面談も随時受け付けてますのでご興味があれば是非ご応募ください!