MapReduceについてのメモ
スポンサード リンク
MapReduceとは
» MapReduce - Radium Software Development
- mapタスクとreduceタスクからなる
- mapタスクはフィルターのこと
- reduceタスクはアグリゲータのこと
- mapタスクが純粋なフィルタなら膨大な数のコンピュータ(ワーカー)に処理を分散できる
- 文章の単語をカウントするとき、各ワーカーのmapタスクは単語に分解してキーと値のペアにする
- reduceタスクは各ワーカーを巡回して、ある単語(キー)に関連づけられた値をカウント(集約)する
» 2004年12月の資料: Google Research Publication: MapReduce
Googleで用いられている、大規模データを処理・生成するための並列分散プログラミングモデルって言われると難しく聞こえてしまう。
» MapReduce - Wikipedia, the free encyclopedia
» TechCrunch Japanese アーカイブ » ヤフーが検索にHadoop採用、グーグルっぽく脱皮を図る
Yahoo!のインデクシングがそのうちちょっぱやになるってことですか?
MapReducemapタスクワーカーreduceタスク単語メモ
前のエントリー: « F905iに見る携帯電話のユーザビリティ
次のエントリー: Google Healthの記事にみる検索エンジン最適化 »
トラックバック
このエントリーのトラックバックURL:
タイトル:
URL:
リンク用HTMLタグ:
powered by Google Chart API





