SQL Server 2016将包含R语言的大数据算法【附下载链接】

发布时间: 2015-11-01 阅读数: 4399

SQL Server 2016最近发布了社区预览版,这个版本可以连接R语言及Revolution R Enterprise的大数据算法。

SQL Server 2016有两种方式来调用R。第一种方式,在SQL存储过程中嵌入R代码,应用程序会调用这个存储过程,将R生成的图形和表格嵌入到程序中。

第二种方式,Revolution R Enterprise现在已包含在SQL Server 2016中,被称为SQL Server R Services ,用户可以用其中的RevoScaleR包创建统计模型,直接使用SQL Server 2016中的数据,并利用数据库的计算能力来拟合模型。在R中的过程如下:

  • 连接到SQL Server 2016数据库(使用登陆凭证)
  • 在SQL Server 2016中通过引用一个表或查询来创建一个对象
  • 在数据库中使用RRE执行计算(在SQL Server2016中设置“coupute context”)
  • 使用RevoScaleR包中的“rx”函数来拟合函数(类似于标准的R语言函数语法)

利用数据库中著名的"airlines"数据集数据,这里的一些代码演示了如何利用这些数据来拟合一个线性回归模型(更多背景资料请看Andrie de Vries的博客)


# 定义SQL Server 连接字符串
con <- sprintf("Driver=SQL Server; Server=%s;Database=%s;uid=%s;Pwd=%s",
                    sqlHost, sqlDatabase, sqlUser, sqlPw)
                    
# 定义数据对象,包括数据库中表的位置
airData <- RxSqlServerData(
    connectionString = con,
    table = "AirlineDemoSmall",
    colInfo = list(ArrDelay = list(type = "integer"),
                      DayofWeek = list(type = "factor", levels = day.names)
    )
 )
 
# 定义计算环境
 rxSetComputeContext(
   RxInSqlServer(connectionString = con,
                 autoCleanup = FALSE,
               consoleOutput = TRUE
    )
)

# 在数据库中执行分析
model.rxLinMod <- rxLinMod(ArrDelay ~ CRSDepTime + Dayofweek - 1, airData)
summary(model.rxLinMod)


更多SQL Server 2016的新特性以及如何访问社区技术预览版请点击下面的链接:
SQL Server blog:SQL Server 2016 Community Techonology Preview 3.0 is available

这周在美国西雅图举办的PASS峰会上,微软的Jason Wilcox和Gopi Kumar演示了SQL Server 2016应用程序中嵌入R代码,来预测赶飞机的时候应该什么时间出发,综合考虑交通状况、值机时间、航班提前出发以及延误等变量。请看这段演示的视频:

底层的预测模型是用运行于SQL Server 2016里的Microsoft R Services模块的RevoScaleR来创建的。时间的预测及app上展示的直方图是在SQL里实时调用R产生的。

官方下载链接:

SQL Server 2016预览版64位

文件大小:3.04G

SQL Server 2016预览版32位

文件大小:2.32G

百度网盘镜像:

SQL Server 2016预览版32位

SQL Server 2016预览版64位

本文由雪晴数据网编译自Revolution R now available as SQL Server R Services,原作者David Smith. 转载请注明本文链接 http://www.xueqing.tv/cms/article/61
分享到:
热门文章

REmap发布,用R绘制百度迁徙图

2015年07月23日更新 19617次阅读

学习R语言,一篇文章让你从懵圈到入

2016年05月09日更新 13584次阅读

清华大学教授:大数据时代 统计学依

2015年08月07日更新 10968次阅读

在R中填充缺失数据—mice包

2015年12月31日更新 9310次阅读

精通 R plot—第一部分:颜色

2016年01月20日更新 7796次阅读

非统计学专业的人该如何学习 R 语

2015年07月24日更新 7745次阅读
热门课程

R语言初级课程

2015年02月20日发布 3098名学员

R语言高效数据清理工具包dplyr

2015年08月30日发布 1624名学员

R语言数据分析入门

2016年05月10日发布 1466名学员

如何用R做数据预处理

2016年06月03日发布 1125名学员

全栈数据工程师养成攻略

2016年11月08日发布 976名学员

R语言大规模数据分析实战

2015年12月17日发布 933名学员
登录 注册