エムスリーテックブログ

エムスリー(m3)のエンジニア・開発メンバーによる技術ブログです

機械学習

画像を理解するGPT-4 Visionで、既存の画像認識モデルを説明可能にする ~ 新宿の特徴は"ビル群"だが、日本橋の特徴は"密集したビル"? ~

特化型モデルで識別・ピクセル重要度抽出した後に、GPTで自然言語に変換する 画像認識モデルを作ったら、そのモデル自体から"こういうオブジェクトがあるから私はこう認識したんだよ"と教えてほしくありませんか? 今回作るのは、図のように、写真が東京都中…

俺が考える最強の「麻雀点数申告練習アプリケーション」を作ってみる ~ Pythonによる麻雀点数計算問題の自動生成と音声による点数申告 ~

Pythonによる麻雀点数計算問題の自動生成と音声による点数申告

DICOMを使いこなして医療画像を扱う

こんにちは、AI・機械学習チームの浮田 (id:uKita) です。今回は、医療画像においてスタンダードとなっているDICOMという規格について紹介します。 私たちのチームでは臨床現場で活用できるAIの開発に取り組んでおり、様々な医療画像を扱っています。中でもX…

ChatGPT Retrieval Pluginに任意のベクトル検索エンジンProviderを実装する

今回はChatGPT Retrieval Pluginがサポートしているベクトル検索エンジンではなく、AWSで利用できる[OpenSearch](https://opensearch.org/) のProviderを実装して、ChatGPTにOpenSearchのベクトル検索を提供する方法を試してみました。

Neovimで手動のスピードで入力しよう!

AI・機械学習チームの北川(@kitagry)です。 最近Neovimの設定ファイルをinit.vimからinit.luaに移動させました。 Lua化したからには何かそれっぽいことをしたいなと思い、機械学習しつつ何かアプリケーションっぽいものを作成することにしました。 タイトル…

Elasticsearch × Bandit Algorithm を使った検索リランキングを最小工数で実現したアーキテクチャ

Elasticsearch × バンディットアルゴリズムで検索リランキングを最小工数で実装したアーキテクチャを紹介します

臨床現場で使われるAIを作る: 胸部X線診断AIの事例と医療画像分類の特徴

こんにちは、AI・機械学習チームの浮田 (id:uKita) です。この記事は エムスリー Advent Calendar 2022 の16日目の記事です。 私達のチームでは、推薦システムなどWebサービスの他に、臨床現場で使われるAIの開発にも取り組んでいます。ちょうど最近、この領…

Slackの絵文字サジェストを機械学習でリバースエンジニアリング ~文字同士のマッチングの学習と高速化~

Slackの絵文字入力サジェストって意外と不思議な挙動をする。普通に部分一致だと思って入力しがちだけど、時々ハッと、あれなんでこの絵文字がサジェストされたんだ?って意外な挙動をすることがある。 例えば上記の会話では、なぜかminorって入力したら"バ…

検索エンジンPyTerrierを使った日本語検索パイプラインの実装

PyTerrierの紹介とPyTerrierで日本語検索を実装する方法を紹介します。

Cascade Model に適用する Bandit Algorithms の理論と実装

Cascade Modelに多腕バンディットを適用したアルゴリズムを調べたので、Pythonによる実装とともに紹介していきます。

数量を機械学習で当てる モデル作成時の工夫と性能説明手法

こんにちは。エムスリーエンジニアリンググループAI・機械学習チームの池嶋です。これは エムスリー Advent Calendar 2021 の16日目の記事です。 AIチームでは機械学習を使ったプロダクトを開発し、自社サービスの改善や医療の臨床領域における研究開発など…

機械学習で逆ストリートビューを作り、写真から港区らしさを判定する

道端で撮影した写真を入れて、それがどこの市区町村かを当てられるモデルを作ることができれば、検証は完了ということになります。 図示したようなCNNモデルを作成します。 そのためには、 市区町村 -> 写真を手に入れるにはGoogle Mapのストリートビューを…

画像の認識・理解シンポジウム (MIRU2021) に参加しました!

エムスリーエンジニアリンググループ AI・機械学習チームの浮田です。 先日の画像の認識・理解シンポジウム (通称MIRU) にエムスリーのAI・機械学習チームから4名参加してきました。

エムスリー AI・機械学習チームのSIGIR'21推し論文を紹介するぜ!

SIGIR'21ワイワイ祭を開催したのでメンバーが担当したセッションごとに推し論文の紹介をします。

エムスリーが技術書典11で新刊を出します

今回技術書典にエムスリーの有志で参加することになりました。近年ホットなRustや機械学習、k8s、検索、ハイパーカジュアルゲームといったワードで、今回も多様な分野・技術について弊社スタッフが執筆いたしました。

分散密ベクトル探索エンジンValdとSentence-BERTを使った類似文書検索を試す

ValdとSentence-BERTを使った類似文書検索を試してみました。

gokart 1.0.0 をリリースしました

はじめに はじめまして。エムスリー AI・機械学習チームの河合(@vaaaaanquish)です。 本記事投稿日と同日、エムスリーが開発しているOSSのうちの1つであるgokartのversion 1.0.0をリリースする運びとなりました。 本記事は、これまでのgokartの軌跡と成果を…

クエリ修正を考慮した検索評価指標sDCGを使ってユーザーの検索体験を監視をしたい

検索評価指標の1つであるsDCGを使ってエムスリーの検索ログから体験の悪かった検索セッションを抽出してみました。

臨床AIはなにができ、何が難しいか: 臨床AI研究開発の3類型

こんにちは、エムスリーエンジニアリンググループ/AI・機械学習チームの大垣 (@Hi_king) です。 これは エムスリー Advent Calendar 2020 の14日目の記事です。 前日は id:juntaki による、Goのchannelとスケジューリングでした。 私達AI・機械学習チームの…

p値と仲良くなる

<エムスリー Advent Calendar 2020 まで残り5日となりました。Advent Calendar本編に先んじて新卒1〜2年目メンバーが執筆します。> エムスリー エンジニアリンググループ AI・機械学習チームの金山 (@tkanayama_)です。 エムスリーでは、主に施策の継続判…

GKEでStreamlitをホスティングして社内用アプリを作った話

ブンブンハローテックブログ。エムスリー AI・機械学習チームでエンジニア兼YouTuberをやっています河合と笹川です。本記事ではStreamlitを使ったGKEホスティングの事例を紹介します。

記事へのタグ付けシステム"Gauss"の精度改善取り組み

はじめまして。エムスリーエンジニアリングG AI・機械学習チーム所属の田中といいます。本ブログ初投稿です。今回は自分が関わっている、Gaussと呼ばれる、記事へのタグ付けシステムに利用する機械学習モデルにおいて一定の精度改善ができたので、ご紹介させ…

Pythonの機械学習用Docker imageのサイズ削減方法の紹介

エムスリーエンジニアリンググループ AIチームの笹川です。 バスケと、ロードバイクが趣味なのですが、現在、NBAのplayoffと、Tour de Franceが同時に開催されていて大変嬉しい毎日を過ごしています。 特にNBAのplayoffは、連日overtimeとなるような激戦や、…

効果検証初心者の落とし穴 〜メルマガ配信時刻最適化システムを例に〜

エンジニアリンググループ AIチーム 新卒2年目の金山 (@tkanayama_)です。 今回は、私が新卒1年目に開発を担当していたメルマガ配信時刻最適化システムの経験をベースにしながら、ABテストで得られたデータを用いて効果検証する際に注意すべき点を架空のスト…

Nishika competitions 2nd solution

はじめに はじめまして、エムスリー AI・機械学習チームの河合(@vaaaaanquish)です。 最近、以下機械学習コンペティションにて 182人中 2位 になりました。 Nishikaサービスローンチコンペ AIは芥川龍之介を見分けられるのか? competitions summary(https:/…

推薦アイテムセットの多様性を考慮したBPR論文を実装・実験した

エンジニアリンググループ AIチームの金山 (@tkanayama_)です。2019年新卒でエムスリーに入社してから早くも1年経ってしまいました。 今回は、 "Bayesian Personalized Ranking for Novelty Enhancement" [Wasilewski and Hurley, UMAP'19] という論文を紹介…

機械学習パイプラインライブラリluigiのshell補完ツールを作った

こんにちは。Python謹製のshellを使って早3年、エムスリーエンジニアリングGの河合 (@vaaaaanquish) です。 この記事はエムスリー Advent Calendar 2019 の21日目の記事です。 エムスリー AIチームでは、機械学習パイプラインとして「luigi」及び、そのwrapp…

行動ログデータからのユーザーアンケート予測モデルを作り、ユーザーの嗜好分類をする

データエンジニアの皆さんが戦われているであろうログデータの活用の話題です。 もちろんエムスリーでもレコメンドやコンテンツの出し分けなどログデータを活用したシステムが開発されています。 今回は、そのログに加えて、アンケートを用いることで、ユー…

クリックだけでなく表示の情報も活用したレコメンド論文の紹介と実装・実験

この記事はエムスリーAdvent Calendar 2019 2日目の記事です。 エンジニアリンググループ AIチームの金山 (@tkanayama_)です。普段の業務では、医療従事者向けWebサイト m3.com のための推薦システムの開発・運用を担当しています。 今回は、 "Sampler Desig…

機械学習プロジェクト向けPipelineライブラリgokartを用いた開発と運用

こんにちは。前回書いた突撃!隣のキーボード M3 2019という記事が、HHKBの公式Twitterアカウントにツイートされ、舞い上がっているエムスリーエンジニアリングGの河合 (@vaaaaanquish) です。 今回はエムスリー AIチームが開発、運用している機械学習プロジ…