2016/02/22tetutaro
分析系雑用係の丸山です。
棚橋くんのMining of Massive Datasets輪読会で2章 MapReduce and the New Software Stackを読みましたの続きとして、3章 Finding Similar Items を読みました。
ジャッカード類似度によるレコメンド(協調フィルタリング)における計算量削減手法として用いられる、Minhashing(特徴量圧縮)・Locality-Sensitive Hashing(類似アイテム検索)について議論しました。