MapReduceについてのメモ
MapReduceとは
» MapReduce – Radium Software Development
- mapタスクとreduceタスクからなる
- mapタスクはフィルターのこと
- reduceタスクはアグリゲータのこと
- mapタスクが純粋なフィルタなら膨大な数のコンピュータ(ワーカー)に処理を分散できる
- 文章の単語をカウントするとき、各ワーカーのmapタスクは単語に分解してキーと値のペアにする
- reduceタスクは各ワーカーを巡回して、ある単語(キー)に関連づけられた値をカウント(集約)する
» 2004年12月の資料: Google Research Publication: MapReduce
Googleで用いられている、大規模データを処理・生成するための並列分散プログラミングモデルって言われると難しく聞こえてしまう。
» MapReduce – Wikipedia, the free encyclopedia
» TechCrunch Japanese アーカイブ » ヤフーが検索にHadoop採用、グーグルっぽく脱皮を図る
Yahoo!のインデクシングがそのうちちょっぱやになるってことですか?
コメントを残す