网络爬虫和大数据技术最近几年成为了每个行业商业成功的重要催化剂。来自网络数据的竞争情报和商业洞察不容忽视。考虑到网络上有海量的信息,如果没有自动化网络爬虫技术,就不可能采集并汇总这些数据。网络爬虫对很多公司来说仍然是块硬骨头。其中大多数公司没有资源和技术自己做网络爬取,因为...
  2017-06-28   4288 查看

开始这篇博客主要记录的是批量读入txt文件并整合的常见方法及其速度比较,然后是解决中文不能写入到MySQL数据库小技巧。这里我首先比较的是readr&dplyr和data.table的读取和拼接速度;其次是比较RODBC和RMySQL这两种不同连接方式...
  2017-06-27   4810 查看

在今年的纽约R会议上,微软的数据科学家LixunZhang做了个演讲,主题为RinFinancialServices:ChallengesandOpportunities。在这个演讲里,他分享了帮助一些国际银行从SAS迁移到R的过程中积累的经验。他的演讲中还介...
  2017-06-13   2574 查看

MicrosoftRServer以前称为RevolutionREnterprise(RRE),原来为RevolutionAnalytics公司的产品。微软在2015年一月份宣布收购RevolutionAnalytics,现在SQLServer2...
  2017-04-28   4535 查看

近期,弗莱堡大学的Oksana Kutina 和 Stefan Feuerriegel发表了一篇名为《深入比较四个R中的深度学习包》的博文。其中,四个R包的综述如下:
  2017-02-18   4024 查看

Docker是最近炒得很火热的一门技术,在网上可以找到关于它的介绍文章,比如《Docker到底是什么?为什么它这么火!》和《开发漫谈:千万别说你不了解Docker!》。但这些文章都是从IT开发人员的角度来介绍的,让我们这些搞数据分析的人摸不着头脑。其实Dock...
  2016-07-19   5715 查看

R中的data.table包提供了一个data.frame的高级版本,让你的程序做数据整型的运算速度大大的增加。data.table已经在金融,基因工程学等领域大放光彩。他尤其适合那些需要处理大型数据集(比如1GB到100GB)需要在内存中处理数据的人。不过这个包的一些...
  2016-07-18   4087 查看

使用dplyr包和RSQLite包实现数据库的连接与管理,轻松处理百M级别数据;数据乱码源头解决方案——readr。
  2016-07-16   3793 查看

这是Jeff David Allen在2016年国际R语言用户大会上分享,演讲者探讨了借助现代R开发环境来使用Spark的能力。尤其是怎么样在R Markdown文档内部甚至在Shiny动态交互应用程序中使用Spark。
  2016-07-11   3572 查看

这是OliverBracht在2016国际R语言用户大会上的演讲,原题和链接为ImplementingRinoldeconomycompanies:Fromproof-of-concepttoproduction...
  2016-07-10   1503 查看
热门文章

REmap发布,用R绘制百度迁徙图

2015年07月23日更新 29161次阅读

精通 R plot—第一部分:颜色

2016年01月20日更新 23101次阅读

学习R语言,一篇文章让你从懵圈到入

2016年05月09日更新 23018次阅读

在R中填充缺失数据—mice包

2015年12月31日更新 22733次阅读

学习Tableau的六大好处(一个

2015年12月24日更新 18336次阅读

精通 R plot—第二部分:坐标

2016年03月15日更新 16586次阅读
热门课程

R语言初级课程

2015年02月20日发布 3293名学员

R语言数据分析入门

2016年05月10日发布 2131名学员

R语言高效数据清理工具包dplyr

2015年08月30日发布 1967名学员

[直播]上海财经大学Python科

2018年01月11日发布 1434名学员

如何用R做数据预处理

2016年06月03日发布 1328名学员

Python训练营课前必看

2017年12月10日发布 1258名学员
登录 注册