5. MapReduce: Simplified Data Processing on Large Clusters
=》Hadoop MapReduce
Bigtable: A Distributed Storage System for Structured Data
=》Hadoop Hbase
The Google File System
=》Hadoop HDFS
2004年,Google的MapReduce论文揭开了大数据处理的时代,
Hadoop的MapReduce在过去接近10年的时间成了大数据处理的
代名词。
2012年Matei Zaharia关于RDD的一篇论文“Resilient Distributed
Datasets: A Fault-Tolerant Abstraction for In-Memory Cluster
Computing”则揭示了大数据处理技术一个新时代的到来。