Mining of Massive Datasets輪読会で2章 MapReduce and the New Software Stackを読みました
2016/02/02k_tanahashi
2016/02/02k_tanahashi
見習いエンジニアの棚橋 耕太郎です。
今週からJure Leskovecらによって書かれた「Mining of Massive Datasets」の輪読会を社内で始めました。この本では、メモリに載らないような大きなデータをどのように処理して活用すべきかについて説明されています。社内の業務では大規模なログデータの分析をする機会があるため、できるだけ少ない計算リソースで大規模なデータを扱うということは重要な課題となっています。
この本のPDFのデータは下からダウンロードすることが可能です。
http://infolab.stanford.edu/~ullman/mmds/book.pdf
輪読会の第1週ではMap reduceについて発表・議論をしました。