AD-TECH
Lab BLOG
アドテクLab ブログ

NEWS
  • リクルートデータ組織のブログをはじめました。※最新情報はRecruit Data Blogをご覧ください。

Mining of Massive Datasets輪読会で2章 MapReduce and the New Software Stackを読みました

2016/02/02k_tanahashi

このエントリーをはてなブックマークに追加

見習いエンジニアの棚橋 耕太郎です。

今週からJure Leskovecらによって書かれた「Mining of Massive Datasets」の輪読会を社内で始めました。この本では、メモリに載らないような大きなデータをどのように処理して活用すべきかについて説明されています。社内の業務では大規模なログデータの分析をする機会があるため、できるだけ少ない計算リソースで大規模なデータを扱うということは重要な課題となっています。

この本のPDFのデータは下からダウンロードすることが可能です。

http://infolab.stanford.edu/~ullman/mmds/book.pdf

輪読会の第1週ではMap reduceについて発表・議論をしました。

2.2. map reduce and the new software stack from Kotaro Tanahashi