F.Ko-Jiの「一秒後は未来」

MapReduceについてのメモ

MapReduceとは

» MapReduce – Radium Software Development

  • mapタスクとreduceタスクからなる
  • mapタスクはフィルターのこと
  • reduceタスクはアグリゲータのこと
  • mapタスクが純粋なフィルタなら膨大な数のコンピュータ(ワーカー)に処理を分散できる
  • 文章の単語をカウントするとき、各ワーカーのmapタスクは単語に分解してキーと値のペアにする
  • reduceタスクは各ワーカーを巡回して、ある単語(キー)に関連づけられた値をカウント(集約)する

» 2004年12月の資料: Google Research Publication: MapReduce

Googleで用いられている、大規模データを処理・生成するための並列分散プログラミングモデルって言われると難しく聞こえてしまう。

» MapReduce – Wikipedia, the free encyclopedia

» TechCrunch Japanese アーカイブ » ヤフーが検索にHadoop採用、グーグルっぽく脱皮を図る

Yahoo!のインデクシングがそのうちちょっぱやになるってことですか?

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

著者について

fkoji

F.Ko-Ji

Webエンジニアやってます。最近は ドットインストール の開発がお仕事です。その傍ら、個人で Meity電車遅延なう梅酒.in#グラドル自画撮り部 の部室といったネットサービスを開発・運営してます。梅酒と草野球とリアル脱出ゲームが好きです。

» 詳しいプロフィールや運営サービスの一覧など