この記事はエムスリー Advent Calendar 2024 23日目の記事です。
AI・機械学習チームの中村伊吹(@inakam00)です。
ソフトウェア開発において、優れたコードの変更は時としてアート作品のような美しさや、抜群の機能改善をもたらすことがあります。GitHubでPull Request(PR)を使ったことがある人なら、感動するようなコード修正に出会った経験があるのではないでしょうか。
エムスリーAI・機械学習チームでは、この感動を共有し称え合うために、年に一度「ベストMerge Request(MR)決定戦」を開催しています。MRとはGitLabのMerge Requestの略称です。 GitHubでいうところのPR(Pull Request)にあたります。
今年も、チームメンバー全員で「これはすごかった!」と感じたコード変更をノミネートし、投票の結果トップ10を選出しました。シンプルな改善から斬新なアイデアまで、いろんな「職人技」が詰まっています。
このブログでは、実際にコードを書いた人や、レビューを通じてその価値を高めることに関わったメンバーたちが、それぞれのMRの魅力について語っていきます。では、第10位から見ていきましょう!
- 第10位 機械学習モデルの性能向上施策
- 第9位 localディスクキャッシュの活用
- 第7位(同率) gokartへのmypy pluginの追加
- 第7位(同率) Kubernetesクラスター都合でのバッチの中断をリトライ回数にカウントしない
- 第6位 ある日突然BigQueryのdownloadが遅くなっていました。さてなぜでしょう?
- 第5位 gokartのlinterを追加
- 第4位 コード検索基盤を構築するためのインデックス作成フロー
- 第3位 Google Cloud ArtifactRegistryのクリーンアップ
- 第2位 TaskOnKartへ型を追加
- 第1位 ロードバランサー一括監視
- まとめ
- We are hiring !!
- エンジニア採用ページはこちら
- カジュアル面談もお気軽にどうぞ
- インターンも常時募集しています
第10位 機械学習モデルの性能向上施策
AI・機械学習チームでは、様々な機械学習モデルの開発や運用をしています。その中のあるモデルの簡素化や取り回しの良さに着目したバージョンアップにおいて、v2モデルがv1モデルと比較して精度が悪化するという課題に直面しました。
調査の結果、主原因の1つが特徴量に対して強制的にSVD(特異値分解)による圧縮を適用していたことだと判明しました。特徴圧縮の処理を見直すことでv2モデルの精度をv1と同等のレベルにまで回復させることに成功しました。
調査から原因究明、対応までなんと2日というスピード感も相まって堂々の10位入賞となりました。
続きを読む