继续浏览精彩内容
慕课网APP
程序员的梦工厂
打开
继续
感谢您的支持,我会继续努力的
赞赏金额会直接到老师账户
将二维码发送给自己后长按识别
微信支付
支付宝支付

大数据知识整理

慕码人9211359
关注TA
已关注
手记 5
粉丝 3
获赞 5

1.hadoop

NameNode 高可用 (High Availability) 实现解析
https://www.ibm.com/developerworks/cn/opensource/os-cn-hadoop-name-node/


2.zk

Zookeeper的功能以及工作原理
https://www.cnblogs.com/felixzh/p/5869212.html


3.hive

hive 源码解析之代码整体结构
https://www.xuebuyuan.com/2181081.html


4.hbase

HBase 官方文档中文版
http://abloz.com/hbase/book.html

HBase写入的各种方式总结汇总
https://blog.csdn.net/shudaqi2010/article/details/88653796


5.spark

park/spark-sql处理schema数据
https://www.cnblogs.com/kangoroo/p/6891540.html

Spark数据倾斜治理
http://www.jasongj.com/spark/skew/

Dataset中Actions、function、transformations
https://blog.csdn.net/legotime/article/details/52562796

Dataset中structField、structType、schame
https://blog.csdn.net/legotime/article/details/52643243

Spark 共享变量:广播变量、累加器
https://blog.csdn.net/wangpei1949/article/details/83335273

DataFrame新增一列的四种方法
https://www.cnblogs.com/itboys/p/9762808.html

Spark SQL将数据写入Mysql表的一些坑
https://blog.csdn.net/dai451954706/article/details/52840011/

Spark 动态资源分配(Dynamic Resource Allocation) 解析
http://www.imooc.com/article/267186


6.flink

Flink 中 timeWindow 滚动窗口边界和数据延迟问题调研
https://blog.csdn.net/xsdxs/article/details/82415450

flink-SQL解析JSON格式数据
http://www.mamicode.com/info-detail-2644620.html

Flink 网络流控和反压剖析
https://yq.aliyun.com/articles/725982/


7.杂项

elasticsearch 常见查询及聚合的JAVA API
https://blog.csdn.net/majun_guang/article/details/81103623

为什么不建议在 HBase 中使用过多的列族
https://blog.csdn.net/bingdianone/article/details/86062506

logstash过滤器插件filter详解及实例
https://www.cnblogs.com/FengGeBlog/p/10305318.html


打开App,阅读手记
1人推荐
发表评论
随时随地看视频慕课网APP