詳解 Apache Spark (amazon.co.jp)

詳解 Apache Spark

Apach Sparkはより高速にビッグデータを処理するための分散処理フレームワークです。SQLインターフェースや機械学習などの機能が標準で組み込まれ、バッチ処理だけでなくストリーミング処理や対話的な処理にも対応できるため、さまざまなシーンのデータ分析を強力にサポートします。本書では、Sparkの基礎であるRDDのしくみ、Sparkを構成する各コンポーネントの機能を理解するところからはじめます。さらにSparkクラスタの構築と運用、構造化データを処理するためのDataFrame APIとSpark SQL、ストリーミング処理のためのSpark Streaming、機械学習ライブラリMLlib、グラフ処理のためのGraphXの各コンポーネントの実践的な利用方法を基礎から徹底的に解説します。

下田倫大, 師岡一成, 今井雄太, 石川有, 田中裕一, 小宮篤史, 加嵜長門


関連カテゴリ
書籍 Scala

人気の検索キーワード


関連書籍

5つの質問に答えるだけ!あなたに最適なプログラミング学習診断 5つの質問に答えるだけ!あなたに最適なプログラミング学習診断