Spark快速大数据分析

发布时间: 2015-10-16 阅读数: 1345

国内第一本Spark图书!


Spark开发者出品!
《Spark快速大数据分析》是一本为Spark初学者准备的书,它没有过多深入实现细节,而是更多关注上层用户的具体用法。不过,本书绝不仅仅限于Spark的用法,它对Spark的核心概念和基本原理也有较为全面的介绍,让读者能够知其然且知其所以然。

内容简介

计算机书籍
如今,所有领域的数据量都在急剧增长。如何才能高效利用这些数据呢?本书介绍了开源集群计算系统Apache Spark,它可以加速数据分析的实现和运行。利用Spark,你可以用Python、Java以及Scala的简易API来快速操控大规模数据集。
本书由Spark开发者编写,可以让数据科学家和工程师即刻上手。你能学到如何使用简短的代码实现复杂的并行作业,还能了解从简单的批处理作业到流处理以及机器学习等应用。
通过阅读本书,你可以:
·快速深入探索Spark功能,比如分布式数据集、内存式缓存,以及交互式shell;
·充分利用Spark强大的内建库,包括Spark SQL、Spark Streaming和MLlib;
·使用统一的编程范式而不需要组合使用Hive、Hadoop、Mahout、Storm等工具;
·学习如何部署交互式应用、批处理应用以及流式计算应用;
·连接HDFS、Hive、JSON以及S3等数据源;
·掌握数据分区和共享变量等进阶知识。

作译者


Holden Karau
Databricks的软件开发工程师,活跃于开源社区。她还著有《Spark快速数据处理》。
Andy Konwinski
Databricks联合创始人,Apache Spark项目技术专家,还是Apache Mesos项目的联合发起人。
Patrick Wendell
Databricks联合创始人,也是Apache Spark项目技术专家。他还负责维护Spark核心引擎的几个子系统。
Matei Zaharia
Databricks的CTO,同时也是Apache Spark项目发起人以及Apache基金会副主席。
分享到:
热点图书
利用Python进行数据分析

利用Python进行数据分析

2015年10月20日发布 1664次阅读
Spark快速大数据分析

Spark快速大数据分析

2015年10月16日发布 1345次阅读
统计学基础

统计学基础

2015年10月26日发布 1225次阅读
R软件及其在金融定量分析中的应用

R软件及其在金融定量分析中的应用

2016年01月13日发布 1114次阅读
数据挖掘:实用案例分析

数据挖掘:实用案例分析

2015年10月19日发布 1110次阅读
R语言实战

R语言实战

2015年10月16日发布 1049次阅读
登录 注册