首席数据官

Hi, 请登录

强烈推荐三本 Spark 新书籍

点击上方 "zhisheng"关注,星标或置顶一起成长

系列文章

前言

看到标题大家可能会想,zhisheng 之前不是一直写 Flink 相关的文章吗?咋开始推荐 Spark 书籍了数据分析推荐书,这里解释一下,因为本人前段时间接手了公司 Spark 引擎,所以偶尔也会抽空学习一下 Spark,这不看到几本不错的 Spark 书籍,于是想在这里与大家分享一下。

《Stream Processing with Apache Spark》

数据分析推荐书_财经网站 ipo 数据 分析_书巢记 分析概括作者将起居室命名为书巢的原因

财经网站 ipo 数据 分析_数据分析推荐书_书巢记 分析概括作者将起居室命名为书巢的原因

这本书出版时间是 2019 年 6 月,算是与 《Stream Processing with Apache Flink》是姊妹篇,主要是讲 Spark 的流处理,比如 Structured Streaming 和 Spark Streaming,对 Spark 流处理感兴趣的不可错过该书,虽然现在 Flink 是流处理的 No1,但是并不影响对比着学习他们之间的技术。

书巢记 分析概括作者将起居室命名为书巢的原因_数据分析推荐书_财经网站 ipo 数据 分析

流处理章节目录 《Learning Spark, 2nd Edition》

数据分析推荐书_书巢记 分析概括作者将起居室命名为书巢的原因_财经网站 ipo 数据 分析

数据分析推荐书_书巢记 分析概括作者将起居室命名为书巢的原因_财经网站 ipo 数据 分析

这本书出版时间是 2020 年 7 月,全书我觉得对于整个 Spark 的体系讲的还是很全的,从概念的介绍,到 API / SQL 的使用,再到如何优化 Spark 作业,接着讲解了 Structured Streaming,然后还讲解了通过 Spark 构建数据湖数据分析推荐书,并且该章节中还对目前很热门的三大数据湖框架 Apache Hudi / Apache Iceberg / Delta Lake 进行了介绍。接着讲解了 Spark 在机器学习相关场景的水碱和应用,最后介绍了 Spark 3.0 的新特性,也是目前唯一不多介绍 Spark 3.0 版本的书籍之一。

书巢记 分析概括作者将起居室命名为书巢的原因_数据分析推荐书_财经网站 ipo 数据 分析

数据分析推荐书_书巢记 分析概括作者将起居室命名为书巢的原因_财经网站 ipo 数据 分析

本书的目录 《Spark in Action, 2nd Edition》

试看结束,如继续查看请付费↓↓↓↓
打赏0.5元才能查看本内容,立即打赏

来源【首席数据官】,更多内容/合作请关注「辉声辉语」公众号,送10G营销资料!

版权声明:本文内容来源互联网整理,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 jkhui22@126.com举报,一经查实,本站将立刻删除。

相关推荐

二维码
评论