由于博客是gitpage页面,最近gitpage被抢了,也就是所有的形如 https://xxx.github.io 的网址都需要科学上网才能访问,由于图片使用国内图床存储,然而gitpage属于外面世界,网络模式设置为:全局模式,才能完全加载。
本系列文章将对《Spark - The Definitive Guide - Big data processing made simple》进行翻译,参照其他译本,取名为:《Spark权威指南》,翻译工作全程由我个人独自翻译,属于对照式翻译,有助于读者理解和校正,如有不当或错误之处,欢迎在本人博客评论指出,方便你我他。注意:github markdown 图片由于属于图库年久不会更新,博客定期每月更新错误和图片。
2018年2月第一版
Part I. Gentle Overview of Big Data and Spark
Part II. Structured APIs—DataFrames, SQL, and Datasets
- 翻译:《Spark权威指南》第4章:结构化API概览
- 翻译:《Spark权威指南》第5章:基本结构化的操作
- 翻译:《Spark权威指南》第6章:处理不同的数据类型
- 翻译:《Spark权威指南》第7章:聚合
- 翻译:《Spark权威指南》第8章:连接
- 翻译:《Spark权威指南》第9章:数据源
- 翻译:《Spark权威指南》第10章:Spark SQL
- 翻译:《Spark权威指南》第11章:Dataset
Part III. Low-Level APIs
Part IV. Production Application
- 翻译:《Spark权威指南》第15章:Spark如何在集群上的运行
- 翻译:《Spark权威指南》第16章:开发Spark应用程序
- 翻译:《Spark权威指南》第17章:部署Spark应用程序
- 翻译:《Spark权威指南》第18章:监控和调试
- 翻译:《Spark权威指南》第19章:性能调优
Part V. Streaming
- 翻译:《Spark权威指南》第20章:流处理基础
- 翻译:《Spark权威指南》第21章:结构化流基础
- 翻译:《Spark权威指南》第22章:事件时间和状态处理
- 翻译:《Spark权威指南》第23章:生产环境中的结构化流
Part VI. Advanced Analytics and Machine Learning
- 翻译:《Spark权威指南》第24章:高级分析和机器学习概述
- 翻译:《Spark权威指南》第25章:预处理与特征工程
- 翻译:《Spark权威指南》第26章:分类
- 翻译:《Spark权威指南》第27章:回归
- 翻译:《Spark权威指南》第28章:推荐
- 翻译:《Spark权威指南》第29章:无监督学习
还有第1,2,30章近期太忙,择日翻译。
Errata | O'Reilly Mediawww.oreilly.com
如果你觉得本系列文章对你有帮助亦或愿意对我的开源付出进行支持,可以对我的本系列文章打赏,毕竟开源不易,由衷感谢你的关注与支持!!!