Spark大数据处理:技术、应用与性能优化

发布时间: 2015-10-16 阅读数: 966

编辑推荐

《Spark大数据处理:技术、应用与性能优化》根据最新技术版本,系统、全面、详细讲解Spark的各项功能使用、原理机制、技术细节、应用方法、性能优化,以及BDAS生态系统的相关技术。


内容简介

作为一个基于内存计算的大数据并行计算框架,Spark不仅很好地解决了数据的实时处理问题,而且保证了高容错性和高可伸缩性。具体来讲,它有如下优势:

  • 打造全栈多计算范式的高效数据流水线
  • 轻量级快速处理
  • 易于使用,支持多语言
  • 与HDFS等存储层兼容
  • 社区活跃度高
  • ……

Spark已经在全球范围内广泛使用,无论是Intel、Yahoo!、Twitter、阿里巴巴、百度、腾讯等国际互联网巨头,还是一些尚处于成长期的小公司,都在使用Spark。本书作者结合自己在微软和IBM实践Spark的经历和经验,编写了这本书。站着初学者的角度,不仅系统、全面地讲解了Spark的各项功能及其使用方法,而且较深入地探讨了Spark的工作机制、运行原理以及BDAS生态系统中的其他技术,同时还有一些可供操作的案例,能让没有经验的读者迅速掌握Spark。更为重要的是,本书还对Spark的性能优化进行了探讨。

作者简介

高彦杰,毕业于中国人民大学,就职于IBM,精通Hadoop相关技术,较早接触并使用Spark,对Spark应用开发、Spark系统的运维和测试比较熟悉,深度阅读了Spark的源代码,了解Spark的运行机制,擅长Spark的查询优化。

分享到:
热点图书
R软件及其在金融定量分析中的应用

R软件及其在金融定量分析中的应用

2016年01月13日发布 2663次阅读
Excel 2010数据处理与分析实战技巧精粹

Excel 2010数据处理与分析

2015年10月19日发布 2644次阅读
利用Python进行数据分析

利用Python进行数据分析

2015年10月20日发布 2490次阅读
Spark快速大数据分析

Spark快速大数据分析

2015年10月16日发布 2018次阅读
Rcpp:R与C++的无缝整合

Rcpp:R与C++的无缝整合

2016年05月10日发布 1974次阅读
R语言实战

R语言实战

2015年10月16日发布 1855次阅读
登录 注册