Google发明的几篇论文解决了各个公司升级服务器的弊端,
分布式框架三篇论文;
google file system
bigTable
MapReduce
流式计算和批量计算:
目前有些人希望通过同一API解决批量计算和流式计算:
Summer bird
Clouddataflow
批量计算 流式计算
数据到达 计算开始前数据已准备好 计算进行中数据持续到来
计算周期 计算完成后会结束计算 一般会作为服务持续运行
使用场景 时效性要求低的场景 时效性要求高的场景
批量计算与流式计算的区别
批量计算 VS 流式计算
批量计算 和 流式计算 的区别
数据到达
计算周期
使用场景
批量计算与流式计算的不同
流失计算与量计算
批量计算计算前要求数据已经准备好了
批量计算 与流式计算的不同