AD-TECH
Lab BLOG
アドテクLab ブログ

NEWS
  • リクルートデータ組織のブログをはじめました。※最新情報はRecruit Data Blogをご覧ください。

Mining of Massive Datasets輪読会で3章 Finding Similar Itemsを読みました

2016/02/22tetutaro

このエントリーをはてなブックマークに追加

分析系雑用係の丸山です。

棚橋くんのMining of Massive Datasets輪読会で2章 MapReduce and the New Software Stackを読みましたの続きとして、3章 Finding Similar Items を読みました。

ジャッカード類似度によるレコメンド(協調フィルタリング)における計算量削減手法として用いられる、Minhashing(特徴量圧縮)・Locality-Sensitive Hashing(類似アイテム検索)について議論しました。

Mining of massive datasets chapter3 from Maruyama Tetsutaro