R语言大规模数据分析实战
售价0
学习人数 1017 课时数量 3课时 课程时长 0小时 47分钟
课程介绍

第一章 突破R内存瓶颈的一些小技巧

  • 升级硬件和软件
  • 减少数据复制
  • 利用整数的优势
  • 有效地存储数据
  • 在转换数据的时候避免循环
  • 在关键函数里使用C、C++或Fortran
  • 尽可能地使用面向行的数据转换
  • 排序之前要三思
  • 使用bigmemory家族的包
  • 借助数据库
  • 使用Revolution R Enterprise(简称RRE)

第二章 RRE的简介

  • RRE学术版的下载与安装
  • RRE的功能介绍
  • 导入数据的函数
  • 概括数据的函数
  • RRE可视化功能
  • RRE所支持的算法介绍

第三章 用RRE做数据探索

  • 导入数据
  • 用rxGetVarInfo()函数查看数据的基本特征
  • 用rxSummary()函数计算数据的描述统计量
  • 用rxHistogram()分析数据的分布
  • 用rxLinePlot()可视化分析两个变量之间的关系
  • 用rxCrossTabs()分析变量间的关系
  • 用with rxCube()分析变量间的关系

第四章 用RRE做数据整理

  • 数据融合
  • 用rxDataStep()做数据变换
  • 用dplyrXdf包整理数据

第五章 用RRE做数据挖掘(案例实战)

  • 数据准备
  • 导入数据
  • 数据探索
  • 线性回归
  • 逻辑回归
  • K-means聚类
  • 决策树分类
视频列表
课程问答
授课教师
陈堰平,北京友万信息科技有限公司首席技术官,北京理工大学大数据创新学习中心业界导师,微软认证讲师,微软认证解决方案专家(MCSE,数据管理与分析方向),2017年1月当选微软最有价值专家。曾先后任新华社指数中心技术总监、SupStat Analytics中国区首席技术官。在统计咨询、数据挖掘、开发数据驱动的商业解决方案等领域有十年的经验,曾为人保财险、国家统计局、微软、惠普、野村综研、德勤咨询、联想、丰田、招商银行、花旗银行、东方航空、中国移动、中国电信、中国联通等机构做过数据科学方面的咨询和培训。擅长讲解R语言和Python数据挖掘、网络爬虫、机器学习以及人工智能等课程。译作有《R语言编程艺术》、《实用数据分析》和《R语言临床数据分析》。
1017位共同奋斗的同学
hotthink
hotthink
yayh06
yayh06
徐超
徐超
星星风格
星星风格
tsaichyi
tsaichyi
哦哦ooo
哦哦ooo
小金鱼学Python啊
小金鱼学Python啊
Alex1
Alex1
yyalex
yyalex
登录 注册