你将获得
- 深入理解Spark内核原理;
- 熟练掌握Spark API及使用场景;
- 全面解析Spark性能调优方案;
- 快速搞定Spark ML机器学习实战。
讲师介绍
课程介绍
本课程基于Spark 3.0.0版本,本着由易到难的设计思路,原理讲解与代码实战交替进行,避免大量原理显得枯燥乏味,也避免不了解原理的情况下进行太多的源码实战,从而仅仅成为一个Spark API使用者。无论你是刚开始学习Spark,还是有了几年的Spark开发经验,本课程都值得你去学习。学习之后你将全面掌握Spark内核原理、Spark资源调度、Spark离线计算、Spark流式计算、Spark任务调优、Spark机器学习等知识。在最后的章节还会介绍大数据的未来趋势相关技术,比如数据湖和AI。为你在未来决胜大数据计算打下坚实的基础。
课程目录
适合人群
学习本课程需要你对大数据基础概念有所了解;具备Scala语言基础,则更有助于理解课程内容。