スポンサーリンク
HadoopとhBaseは、Googleの基盤ソフトウェアのオープンソースクローンであり
大規模分散計算フレームワーク「Hadoop」と、その上につくられた大規模分散データベース「hBase」の仕組みとあらば Hadoop & hBase なる両者が要諦なるGFSクローンの、では図を参照するにその対応関係は
- GFS:Hadoop DFS
- MapReduce:Hadoop MapReduce
- BigTable:hBase
- Google File System:分散ファイルシステム
- MapReduce:分散計算フレームワーク
- BigTable:スケーラブル分散データベース
- Chubby:分散ロック管理サービス(未クローン化)
非常にスケーラブルかつ故障に強いと説明されるのは巷間流布した話、 此のクローンがオープンソースとして利用出来るとなれば、 心を動かすなと云うが禅師ならぬ、 併せて当ブログにて Google App Engine なる怪しげなカテゴリーを拵える此の身には無理な話、
Hadoopは主にYahoo! Inc.のDoug Cutting氏によって開発が進められているオープンソースソフトウェアです。現在はApacheプロジェクトのTopProjectとなっています。Hadoopという名前はDoug氏の子供が持っている黄色い象のぬいぐるみの名前に由来しているらしいです。と聞けば是非、 Cutting氏のぬいぐるみの黄象を応援し度、強く思います。
Hadoop&hBaseの概要を閲すれば基本的にJavaでの使用が前提とされる様ですが、 拡張パッケージの使用で C/C++・Ruby・Python 使いにも門戸が開ける由、 採用実績 にも迂闊な此の身には驚くべき一覧の 当のGoogle迄にも利用されるのも又一興、 又、@ITに2008年12月1日の記事は西村賢氏の文責なる 大規模分散処理フレームワークの設計、実装が進行中/楽天版MapReduce・HadoopはRubyを活用 にて面白くも項目立てられるタイトルには「 楽天も情報爆発しています 」があり、言及されるを引用するに
計算モデルがシンプルでも規模が巨大になるとまったく別の問題が生まれてくる。処理すべき情報量が爆発的に増加しているからだ。にて、対処するに以下
- アルゴリズムの工夫
- 大規模分散処理
上流工程に於けるSQLスキルの必要性
なかなかに刺激的な記事は@IT自分戦略研究所の2009年1月20日に掲載上流の技術者はSQLを習得すべきにて、筆者の株式会社ジーワンシステム代表取締役生島勘富氏は炎上上等と云う事で、自ら燃料投下抔の炎上努力をなされている甲斐あって、コメント欄も活発で様々な立場からの