Hadoopとは?
Hadoopとは、オープンソースのソフトウェアプラットフォームで、大規模データの処理とストレージの管理が主な目的とされています。
Hadoopの読みは「ハドゥープ」と読みます。
Hadoopの特徴として、オンライン広告のアクセスログの解析であったり、売れ筋商品の分析等の大規模なデータを効率良く処理できることから、Webサービスを提供している企業では、国内外問わずHadoopでの大規模分散システムの構築が使用されています。
また、分散処理機能を実現しているのが、HDFSとMapReduceの2つとなります。