面向决策的数据分析:R语言数据挖掘实战案例研讨会

发布时间: 2017-07-01 阅读数: 3246

会议主题

R语言数据挖掘、机器学习、文本分析案例实战

时间地点

2017年7月22日--7月23日  北京理工大学(具体教室会另行通知报名学员)

(时间安排:外地参会人员21日报到,22日~23日正式会议,24日答疑,学员可针对自身情况选择参加 )

主办机构

主办方:雪晴数据网

雪晴数据网是以数据科学为主题的在线社区,运营实体为绘辰科技(北京)有限公司。网站包含视频课程、问答、资讯等模块。雪晴数据网专注于大数据、数据分析、数据挖掘、数据科学技术的普及和推广,致力于向数据科学从业者提供沟通平台。

雪晴数据网已成为Microsoft高级分析培训团队的在中国大陆地区唯一的合作伙伴,也是RStudio公司在中国大陆唯一的合作伙伴。

协办方:北京理工大学大数据创新学习中心北京友万信息科技有限公司、爬虫俱乐部

培训目标

本次研讨会采取深入浅出的方法,先以简单的案例引入R数据分析的基本原理,随后重点讲解多种常用单元的功能和特性,以及有R数据分析与数据的实用技术和处理方法,结合应用实例,针对工作中存在的疑难问题进行分析讲解和专题讨论,有效提升与会者解决复杂问题的能力。学完课程之后,学员可以用R作为工具独立完成数据挖掘的整个流程。

培训特点

有别于其他培训机构将机器学习、数据挖掘技术拆解开讲解的方法,我们以全流程的完整案例讲解利用R完成数据整理、探索性数据分析、建模分析、模型评估、报告展示等环节。

有别于有些培训机构将R语言的培训做成编程语言和函数介绍的做法,我们将R语言的应用与业务实际相结合。

我们还有动手实践环节,有老师和助教解答学员在操作中遇到的问题。

还将针对工作中存在的疑难问题进行分析讲解和专题讨论,有效提升学员解决复杂问题的能力。

学习结束后,学员可得到本次课程的全程视频,以便进一步学习。

为什么要学R语言,学了以后有什么好处?

不论您是在互联网行业,还是在银行,抑或是在高校里做教学科研的工作,有可能会接触到数据处理、数据建模的问题。有可能在你组织机构内部的数据不够,你需要从网上爬取更多的数据。在将你的业务问题转化为数据分析的问题之后,就需要使用工具来帮你做数据处理和建模的工作。相对于SPSS来说,R更加灵活,包含有从数据获取、数据整理、建模、可视化展示、自动化报告等完整的分析流程所需要的功能。相对于C++、Java这些通用编程语言来说,R是专门为数据分析的任务设计的,语法更简洁,学习成本更低,功能更强大。根据我们多年的经验,非计算机专业的人学习R语言,会更快上手。

网上有很多R语言的课程,为什么要选雪晴数据网?

市场上有各种R语言的课程,各有各的特色及优点,有的还是免费的,这里我们不比较各自的不同,就说说我们有什么优点吧:

  • 优秀的讲师团队:我们的讲师不但有多年的工作经验,也有丰富的教学经验,不但技术过硬,也善于用通俗的语言讲解复杂的知识点,更有耐心为学员解答学习过程中的问题。每次课程我们都会反复研究,花大量时间准备课程材料,力求用最适合的案例和方式为学员讲解。
  • 案例教学的方法:我们从2013年开始举办公开的技术培训,也曾多次给企业做内部培训,从多年的教学实践中,我们发现,用传统以知识点讲解为主线,案例为辅的方式,效果并不好。学员反映,听了后面忘前面,学了一堆东西却不知道怎么用。经过多次尝试,我们摒弃了这种教学方式,采用以案例为主线,在案例中讲解知识点的方法,在一个案例中串联多个知识点,利用遗忘曲线的原理,我们用多个案例重现数据分析的流程,学员自然会举一反三了。
  • 选取有实用价值的案例:iris数据集、titanic数据、NBA比赛数据跟我们的工作和科研有什么关系?基本没关系,那我们在讲课的时候就不会用这种数据。而且我们教的是如何使用数据分析技术,并不是教你怎么写代码,我们不培养码农的。所以我们选择的案例,都是有现实的商业意义,或者科研价值。在讲解过程中,不但告诉你代码怎么写,还会教你怎么解决问题,为什么要这么做。
  • 贴心的助教制度:我们每次开课都会有助教,因为是手把手的课程,助教的存在,就是为了能解答您的问题,确保您有学会,满载回家。而且我们的助教都有实战经验,有的来自业界,有的可能就是前几批的优秀学员,我们也欢迎您以后加入我们的助教或讲师团队。
  • 对课程品质的坚持:我们在不同场合讲解过课程的内容,不断调整打磨课程,即使是相近的主题,我们也会对课程内容和案例进行升级,挑选出最适合市场趋势的案例和技术来讲解。

报名参加培训之后,还能得到什么福利?

  • 报名参加我们的课程,就自动成为我们的VIP会员,以后购买我们的线下或线上课程都有优惠。
  • 加入到我们的VIP微信群、QQ群中,以后在学习中如果遇到问题,我们的老师和助教会帮忙解答
  • 一些不方便大范围分享的演讲视频和课程视频,我们会优先分享给VIP会员
  • 我们组织的内部分享会,VIP会员有优先报名权

没有学过R,也可以来上课吗?

当然可以。其实每次都有对编程一无所知的小白来参加我们的课程,他们甚至对电脑的很多知识都不甚了解,经过两三天的课程,不少人不但跟下来了,还很有收获。对R有一点认识的朋友相信一定可以得心应手,针对完全没有碰过R的新手,报名之后我们会推荐您R的基础在线课程进行课前的练习,也可以提前一天报到,参加我们的课前辅导。

培训对象

从事互联网、金融、医疗、生态、经济、统计、银行、通信、环境行业的数据分析从业人员,以及相关企事业单位技术骨干、科研院所研究人员,和大专院校相关专业教学人员及在校研究生、硕士、博士等相关人员。

讲师介绍

陈堰平,雪晴数据网创始人,北京理工大学大数据创新学习中心导师团成员,2017年1月获“微软最有价值专家”荣誉称号。毕业于中国人民大学统计学院,曾获CQF国际数量金融认证,先后任新华社指数中心技术总监、SupStat Analytics中国区首席技术官。在统计咨询、数据挖掘、开发数据驱动的商业解决方案等领域有近十年的经验,曾为国家统计局、微软、惠普、德勤咨询、联想、丰田、招商银行、花旗银行、东方航空、中国移动、中国电信、中国联通、国家检察官学院等机构做过数据科学方面的培训和咨询。曾开发贝叶斯动态预测模型的R包ssDLM,译作有《R语言编程艺术》、《实用数据分析》和《R语言临床数据分析》,主讲的在线公开课《R语言数据分析入门》、《R语言大规模数据分析实战》已在多个平台上发布,累积学习人数过万人。

培训费用

在职人员2000元/人,学生1600元/人(含会议注册费、资料费、场地费)。食宿费用自理。

参与雪晴数据网奖学金计划,更可以减免大笔学费,只要你足够勤奋,可以免费学!!

奖学金计划

  1. 为雪晴数据网(www.xueqing.tv)投稿的用户(原创或翻译文章),可以获得代金券(按文章质量,奖励50到200元不等),以抵扣线上线下课程学费,投稿请联系管理员 contact@xueqing.tv
  2. 注册并登录雪晴数据网,进入用户中心,然后进入邀请页面(http://www.xueqing.tv/me/invite ),获得邀请链接后,转发给好友,如果对方成功注册,双方都可获得奖励,可抵扣学费。
  3. 累计五天(可不连续)转发本课程通知到自己朋友圈,并附上推荐理由,截图发给我们的工作人员,报名可优惠200元。

优惠政策

  1. 现场班老学员8折优惠
  2. 三人以上同时报名9折优惠
  3. 五人以上同时报名8折优惠

课程安排

本次讨论会采取“线上+线下”的方式,雪晴数据网已经上线了数门在线课程,免费向公众开放,我们会在课程里介绍R语言的基础知识。参加线下课程的学员,除了可以学习线上免费课程,还可以在线下学习更加深入的行业案例,并在课后得到线下课程的视频。

线上课程

  • R语言的介绍及基础语法:如何学习R,R的数据结构,控制语句等
  • 读写数据:从文件、网络、数据库等数据源读取数据,保存数据到文件、数据库
  • 数据整理入门:数据的变换、重塑、拆分合并以及汇总
  • 数据可视化:基础绘图系统、lattice、ggplot2等介绍

请于线下课程开始之前自己学习以下课程

线下课程

时间: 2017年7月22日(周六)~23日(周日) 地点:北京理工大学

课程大纲

第一天 第一讲
R语言介绍及R语言基础语法
  1. 什么是R 及如何学习R
  2. Rstudio,扩展包,工作空间
  3. 数据对象
  4. 向量化操作
  5. 函数和控制语句
  6. R命令提示符及R 脚本文件

涉及知识点:

  • dplyr包:数据整理、筛选、汇总
  • ggplot2:数据可视化
  • 探索性数据分析:交叉表
  • 预测性分析:利用指数平滑等方法预测销售量
  • knitr与Rmarkdown:自动化报表
  • flexdashboard包:仪表盘
  • 网络爬虫
  • 文本分析

案例一: 针对一份电子商务网站的订单数据,从产品、客户、地区等维度来分析销售额和利润,也可以时间的维度纵向分析销售趋势。

案例二: 抓取中国政府网历年政府工作报告,并做文本分析

第二讲
数据整理与数据可视化
  1. 数据变换、重塑及拆分合并
  2. 汇总数据、字符串操作、日期操作
  3. R语言中的可视化函数
  4. 单变量的特征 、比例的构成
  5. 多变量的关系、展现时间的变化
第三讲
用R做可重复研究和自动化仪表盘
  1. 如何用R在重复研究中自动生成分析报告
  2. 可视化展示:并用flexdashboard包创建仪表盘,实现各地区销售额动态比较图
  3. 用knitr编写自动化报告
第四讲
网络爬虫与文本分析
  1. 利用rvest包爬取页面
  2. 分词、词频分析、词云等文本分析
第二天 第五讲
初等统计方法及线性回归模型
  1. 简单线性回归
  2. 回归诊断
  3. 多元回归
  4. 主成分分析等等

涉及知识点:

  • glm、glmnet、rpart、xgboost等函数和包的使用
  • 因子变量的处理
  • 共线性的识别和处理
  • Logistic回归模型系数的商业理解
  • Microsoft R Server的介绍

案例三: 某连锁餐厅为提高营业额,做了一次市场调查,根据收集到的数据,分析是哪些因素影响营业额,并提出改善经营的建议

案例四: 预测贷款逾期者(银行业) -- 某银行希望根据客户过去的贷款数据来建模,以便用模型来预测新的贷款者,核贷后会逾期的机率,以做为银行是否核贷的依据,或提供给客户其他类型的贷款产品。

案例五: 零售业销售促销(零售业):此案例的目的是想根据零售产品过去的促销记录,利用神经网络及回归树(Neural Network & Regression Tree)来预测未来的销售成效。

第六讲
Logistic回归及多分类Logistic模型
  1. logistic回归原理
  2. 实现原理及输出解释
  3. 无序多分类的logistic回归模型
第七讲
数据挖掘模型
  1. 基于树的模型:决策树、随机森林
  2. boosting方法:adaboost、XGBoost
  3. 神经网络与深度学习
第八讲
利用Microsoft R Server突破内存限制做海量数据挖掘
  1. Microsoft R Server 9.1的下载及安装
  2. Microsoft R Server中大数据包的介绍
  3. 案例演示

往期学员评价

做为学员,体会到雪晴数据网的培训课程有三个最大的特点:

第一个就是实用,因为培训老师都有着丰富的项目经验,课程从设计到教学都是从一个非常实用的角度,特别强化一些实际工作或研究中会碰到的问题的解决方法,并且结合了实际案例进行解说,真正能让学员学以致用。

第二个就是深入浅出,课程的设计有合理的层次,首先,在让初学者通俗易懂的时候,也不乏让有基础的同学在系统性巩固基础知识的同时,也学到一些之前可能忽略掉的一些实用的小技巧,其次,课程会带领学员有序的,渐渐深入一些比较深度的内容,所以,整个培训在课程内容充实的基础上,保证了大家都能将每个知识点都变成自己的收获。

第三个就是前沿性,目前市场上有各种培训,书籍,介绍着各种各样的工具以及研究方法,在这个咨询量爆发的时代,我们需要把不多的学习时间有效率用在真正能学到“干货”的地方,雪晴数据网的培训课程不仅课程内容实用性强,而且精选了各种主流的数据研究方法,作为课程内容,让我们这些来自企业的担任数据分析职能的人员,能够在短短几天的培训中,对一些数据分析新领域快速的入门,以及对自己现有技能进行一个有效的强化,感谢雪晴数据网。

—— 励敏,安吉斯媒体集团,部门总监

当时我是公司派来学习的,因为工作上需要用到R语言。三天的培训,时间很短,但是老师丰富的经验足够带我这样零基础的学员入门,并且教了比较重点和常用的知识。虽然短暂的三天成为不了R语言高手,但是足够让自己从中找到很多工作上需要用到R语言包,并且完成工程任务。很感谢这样实用的培训,如果有机会参加进阶的学习,我还会参加。

—— 王挺,北京数字新思科技有限公司,产品经理

邀请陈堰平老师给我们部门做R语言及统计的短期培训源于我们部门承接的操作风险量化预测的项目需求,陈老师在有限的培训时间内给我们介绍了常见厚尾统计分布模型,常用的R统计算法库及优秀的ggplot工具在数据可视化方面可以带给我们的帮助。他做了我们在R及统计方面的很好的引路人,使我们在后续使用R完成统计分析工作上有了很大的信心。

—— 陆锋,花旗金融信息服务(中国)有限公司,项目经理

往期培训

2017年1月R语言机器学习案例实战研讨会合影

2017年6月Python爬虫与文本分析案例实战研讨会合影

2017年6月联通Python数据分析培训

2016年9月微软R语言高级分析培训

常见问题

答:我们是正规公司,可以开具增值税普通发票和增值税专用发票,用户根据需要来选择发票类型。

答:可以,我们有POS机,可以打印小票。

答:你可以先看看我们网站的视频课程入个门,再决定是否报名,另外,希望你有大学数学的基础,否则会很吃力。

答:提供,请与我们的工作人员联系。

报名方式

请前往http://xueqingtv.mikecrm.com/p46FJaW填写报名表,我们随后会联系您。确认报名后,请通过以下三种支付方式中的一种来缴费(请保留支付凭证,拍照或截图发给我们的工作人员 ):

方式一: 对公转账

开户名       绘辰科技(北京)有限公司              

开户银行   中国工商银行股份公司北京大钟寺东路支行       

账号        0200151609100034763 

方式二: 支付宝

账号     pay@xueqingtv.com

户名    绘辰科技(北京)有限公司

方式三: 现场缴费

外地学员请于21号提前报到,北京学员可于22号早上8点~8点半报到,缴费并领取发票和纸质邀请函,以及上课教材。

由于22号早上现场人比较多,鼓励北京学员也于21号报到

联系方式

联系人:陈洁老师

手机/微信:136-6072-3699

QQ :529698127  验证信息请填写R培训

Email:contact@xueqingtv.com


如果对Python感兴趣,也可以关注7月21~23日的Python实战案例研讨会:爬虫与文本分析

如果对SAS感兴趣,也可以关注7月29~30日的SAS编程图表与医学统计研讨会

分享到:
热门文章

REmap发布,用R绘制百度迁徙图

2015年07月23日更新 21685次阅读

学习R语言,一篇文章让你从懵圈到入

2016年05月09日更新 15365次阅读

在R中填充缺失数据—mice包

2015年12月31日更新 11789次阅读

清华大学教授:大数据时代 统计学依

2015年08月07日更新 11477次阅读

精通 R plot—第一部分:颜色

2016年01月20日更新 10689次阅读

学习Tableau的六大好处(一个

2015年12月24日更新 8575次阅读
热门课程

R语言初级课程

2015年02月20日发布 3293名学员

R语言高效数据清理工具包dplyr

2015年08月30日发布 1724名学员

R语言数据分析入门

2016年05月10日发布 1618名学员

如何用R做数据预处理

2016年06月03日发布 1178名学员

全栈数据工程师养成攻略

2016年11月08日发布 1068名学员

R语言大规模数据分析实战

2015年12月17日发布 959名学员
登录 注册