登录 注册
数据整合操作和建模辅助技术
售价0
学习人数 402 课时数量 3课时 课程时长 1小时 17分钟
课程介绍

本视频是林荟在统计之都海外线上沙龙第21期的分享,观看Slides,下载R代码1R代码2

演讲者介绍

林荟女士现任杜邦公司商业数据科学家,曾经在Iowa State University先后担任兽医学院统计咨询师及商学院统计咨询师,研究兴趣在预测模型,机器学习,数据可视化,市场营销调查分析,消费者行为分析,自然语义处理和文本挖据,健康与疾病统计分析等方面。

演讲摘要

本次沙龙将介绍一些经常用到的有效数据整合方法,和R中可以实现这些整合的函数(base包[apply()]、plyr包[ddply()],reshape2包,和tidyr包)。

此外嘉宾还将介绍一些非常重要的建模辅助技术和概念(由于时间关系,这部分只能讲一半):

  • 误差及其来源
    • 系统误差和随机误差
    • 因变量误差
    • 自变量误差
  • 数据划分和再抽样
    • 划分训练集和测试集:按照结果变量划分数据,按照自变量划分,按时间序列划分
    • 重抽样:交叉校验,Bootstrap
  • 评估模型表现
    • 回归模型表现度量
    • 分类模型表现度量
版权声明

本课程讲师已授权雪晴数据网发布本视频,任何组织或个人都不得违反原演讲者的版权声明:

对于COS海外沙龙发布的视频,访问者可将视频用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯统计之都及相关权利人的合法权利,若转载需注明出处。本视频不允许转载用于商业用途,盗版必究。

课时列表
课程问答
友荐云推荐
402位共同奋斗的同学
小安
小安
benben
benben
苏鲁鲁卡
苏鲁鲁卡
xiaopang
xiaopang
小咪咪呢
小咪咪呢
锦灏2008
锦灏2008
DATA徐
DATA徐
小秋
小秋
鸡蛋壳
鸡蛋壳
登录 注册