其他更多java基础文章:
java基础学习(目录)
最近知乎认识了一个小伙伴,推荐了《Spark权威指南》(Spark: The Definitive Guide)这本书给我。过去市面上Spark相关的《Spark源码剖析》等之类的书都停留在spark1.x,现在主流公司都已经在用2.3.X甚至准备升Spark3了,市面上的书版本跟进的慢,读的价值没有以前大。
读完后感觉这本书比较适合刚学习Spark框架的朋友看,或者说当一本工具书也可以,较为全面的介绍了2.X版本主推的DataFrame,DataSet,Structured Streaming的各种方法,输入,输出等。不过有能力还是搭配着Spark官方文档一起看比较好,又全又有例子。
但是本书对Spark一些底层的优化,或者设计原理说的比较少。比如2.X重点推的df,ds底层的Catalyst优化等,所以要想研究深,还是得硬着头皮看英文官网和源码本身去学。
以下是东北大学的翻译组对《Spark权威指南》的翻译稿
以下是这位小伙伴的学习笔记