2. About me
• Intel大数据开发部,Storm PMC
• 2014年之前做IDH Hadoop发行版,现从事Hadoop
开源工作,
• 历史工作包括 MapReduce NativeTask,HBase图像
存储 Large Object Store (MOB),Storm性能优化,
创立Gearpump项目等。
20. 分布式消息传递的挑战
Partition and Shuffle
1. Partition & Shuffle, 数据通道多,数据碎!
2. 流内每个节点能力不同,处理速度不匹配,容易内存
OOM,IO阻塞,CPU Hang等
N * N 个数据通道!
select * from R join S on R.key = S.key