13. Our goal was to design a programming model that supports
a much wider class of applications than MapReduce, while
maintaining its automatic fault tolerance.
我々の目的は、 MapReduce が持つ耐障害性を維持しつつ、
より多様なアプリケーションをサポートする
プログラミングモデルを設計することでした。
http://spark.apache.org/research.html
14. In particular, MapReduce is inefficient for multi-pass
applications that require low-latency data sharing across
multiple parallel operations.
特に、MapReduce は複数の並列処理間で低遅延の
データ共有を行う多段アプリケーションでは非効率です。
http://spark.apache.org/research.html
15. • Iterative algorithms, including many machine learning algorithms
and graph algorithms like PageRank.
• Interactive data mining, where a user would like to load data into
RAM across a cluster and query it repeatedly.
• Streaming applications that maintain aggregate state over time.
• PageRank のようなグラフ処理や、多くの機械学習アルゴリズムを
含む、繰り返しのアルゴリズム。
• クラスタの複数ノード間に渡ってロードされたデータに対し、
繰り返しクエリを発行するような対話的データマイニング。
• ストリーミングアプリケーション。
http://spark.apache.org/research.html