R语言大规模数据分析实战
售价0
学习人数 882 课时数量 3课时 课程时长 0小时 47分钟
课程介绍

第一章 突破R内存瓶颈的一些小技巧

  • 升级硬件和软件
  • 减少数据复制
  • 利用整数的优势
  • 有效地存储数据
  • 在转换数据的时候避免循环
  • 在关键函数里使用C、C++或Fortran
  • 尽可能地使用面向行的数据转换
  • 排序之前要三思
  • 使用bigmemory家族的包
  • 借助数据库
  • 使用Revolution R Enterprise(简称RRE)

第二章 RRE的简介

  • RRE学术版的下载与安装
  • RRE的功能介绍
  • 导入数据的函数
  • 概括数据的函数
  • RRE可视化功能
  • RRE所支持的算法介绍

第三章 用RRE做数据探索

  • 导入数据
  • 用rxGetVarInfo()函数查看数据的基本特征
  • 用rxSummary()函数计算数据的描述统计量
  • 用rxHistogram()分析数据的分布
  • 用rxLinePlot()可视化分析两个变量之间的关系
  • 用rxCrossTabs()分析变量间的关系
  • 用with rxCube()分析变量间的关系

第四章 用RRE做数据整理

  • 数据融合
  • 用rxDataStep()做数据变换
  • 用dplyrXdf包整理数据

第五章 用RRE做数据挖掘(案例实战)

  • 数据准备
  • 导入数据
  • 数据探索
  • 线性回归
  • 逻辑回归
  • K-means聚类
  • 决策树分类
课时列表
友荐云推荐
授课教师
雪晴数据网创始人,北理工大数据创新学习中心导师团成员,2017年1月获“微软最有价值专家”荣誉称号。毕业于中国人民大学统计学院,曾获CQF国际数量金融认证,先后任新华社指数中心技术总监、SupStat Analytics中国区首席技术官。在统计咨询、数据挖掘、开发数据驱动的商业解决方案等领域有近十年的经验,曾为国家统计局、微软、惠普、德勤咨询、联想、丰田、招商银行、花旗银行、东方航空、中国移动、中国电信、中国联通等机构做过数据科学方面的培训和咨询。曾开发贝叶斯动态线性模型的R包ssDLM,译作有《R语言编程艺术》、《实用数据分析》和《R语言临床数据分析》,主讲的在线公开课《R语言数据分析入门》、《R语言大规模数据分析实战》已在多个平台上发布,累积学习人数过万人。
882位共同奋斗的同学
旅夜飞鱼
旅夜飞鱼
wpxlionel
wpxlionel
LILIAN XU
LILIAN XU
大脸猫要减肥
大脸猫要减肥
刹那
刹那
Chameleon
Chameleon
mm227
mm227
 ilan
ilan
李智凡
李智凡
登录 注册