阿里巴巴集团CTO王坚:互联网、数据和计算

发布时间: 2015-12-11 阅读数: 780

12月10-12日,2015中国大数据技术大会(Big Data Technology Conference 2015,BDTC 2015)在北京盛大开幕。

2015中国大数据技术大会首日全体会议中,阿里巴巴集团CTO王坚带来了名为“互联网、数据和计算”的主题演讲。王坚表示,数据是被沉淀下来的,而非存在价值限制性的收集。互联网、数据与计算相互依存,不在互联网上的数据基本价值甚微,数据天然存在,但只有被计算才能真正发挥价值。而当信息无法告知用户世界为何样时,数据能够完整地描绘出。所以,让互联网成为基础设施,数据变成生产资料,计算变成公共服务,是关于这个世界的创新和创造的平等与自由实现。

阿里巴巴集团CTO 王坚

以下为演讲实录:

王坚:非常感谢大会给予这次机会。这几年,有几个东西非常特别。有一次,我在中国工程院开会时被人提了个问题,蛮受刺激的。当时我在上面发言,下面有人提问题:有了互联网技术以后,又有了移动互联网,再后来云计算、大数据乃至物联网开始盛行,您觉得下一个技术趋势是什么?我说我的理解是:至少在五十年以内,互联网在我有限的知识范围内还是个技术趋势。

所以今天,我的演讲主要围绕“互联网、数据和计算”,分别分享我对它们的理解与认知。

一、关于互联网:社会经济发展得基础设施

时至今日,我发现,大家对互联网的认识有时候会高估,而有时候也会大大低估。前几年在讲移动互联网时我很困惑,我认为“移动互联网不是互联网”,但过两年就反悔了,又改说“移动互联网还是互联网”。其实今天,如果让我来定义互联网究竟是什么,我就用一句话来定义——“整个社会经济发展的基础设施”。

我认为互联网是个基础设施。这句话听起来挺抽象,所以我经常拿北京八达岭高速调侃。对我来讲,这条路无论标准修得多高、速度多快,但对我来讲就是个便道,只解决从北京城到八达岭的简单需求。今天,这条路属于京藏的一部分,这时候才真正变成国家的基础设施。

所以过去,当我用帐号上互联网时,它还不是基础设施,只是一个简单的工具,不能形成对社会普遍的影响。但是今天,互联网这个基础设施已经发展到了什么程度?大家都知道电是基础设施,可是为什么在这么一个阳光明媚的时间里面,大家全部用人工照明?因为电的成本不是问题了。过去把电作为一个基础设施,每一次装修、建筑时,首当其冲便是将插座做好。但是今天诸位坐在这里,左看右看,是找到一个电源插座容易,还是登陆互联网容易?因为你有手机,使得后者比前者更为容易。这意味着什么?意味着互联网已真正成为一个基础设施,它的无所不在超过历史长河中人类任何一个基础设施,这才是它真正的魅力。

认真想一下,今天大部分人在讲互联网或一个互联网公司时,包括大家心中的目前中国三家比较大的互联网公司,其实回过头来看,这些公司其实就是传统的互联网公司,为什么?最早的互联网只是把全世界的PC连在一起,形成最早的互联网,称之为Web。而当将所有移动设备连接在一起时,“移动互联网”的概念应运而生。只是将过去那些不能存在于网络的数据连上时,大家谈到了物联网。对此,专家们应该负比较大的责任。我参加过很多活动,无论是学者还是行业专家,有意无意地,都会将物联网讲成一个比互联网还要了不起的东西。

这个词的翻译曾闹过笑话,我之前与诺贝尔奖获得者做个节目,现场请了个翻译。有人提问他们对于物联网的看法,现场翻译不知道该如何准确翻译物联网。这是一个很有意思的现象,就像今天大家讲“互联网+”时,实际上是告诉大家互联网变得愈发重要。

二、关于数据:生产资料

数据的概念迄今为止我都还处于较为模糊的状态,为什么今天突然讲到数据?第一,跟互联网有关系,第二,跟互联网作为一个基础设施有关系。此话何解?设想一下,历史上只要有信息就有数据,信息是跟人类很多其他活动融合在一起,而数据则是与基础设施连在一起。比如我们修一条路,这是最基本的基础设施,只要修了路就会有数据。那么,这个数据是什么?就是你走过的脚印,脚印是自动留在基础设施上,只不过路的基础设施让脚印这样一个重要的数据没有很好地沉淀下来变成社会财富。曾经,想要使用这个脚印,将它变成财富,是成本极高、极其困难的,所以只有公安破案的时候才会使用。

由此可见,数据这件事情是跟基础设施与生俱来的,只不过互联网这个基础设施从第一天的设计开始,使得它沉淀数据的速度、方法、价值都远远超过了传统的任何基础设施,这是它非常不一样的地方。设想一下,如果每个脚印都被留下来,都能数字化,都像今天鼠标点击那么容易处理的话,今天互联网公司做的所有事情都可以做到,只不过并没有因此产生巨大的价值而已。

另外,我听不得的一句话,就是“数据是搜集起来的”,我一直坚持“数据是被沉淀下来的”。当一个数据被人搜集时,它的价值也就被搜集数据人的目的给束缚住了。过去,预测谁会成为美国总统,到街上进行问卷调查,基本上就能八九不离十。但今天是如何知晓的?将所有的聊天数据处理一遍即可。它们之间的差别是什么?差别就在于有一天存在其他需求时,不需要再去做问卷调查,而可以将Twitter数据处理一遍。因为你不知道这个数据是干什么的,使得这个数据的价值被大大增加。互联网让大家对数据的认识远远超出过去,原因是什么?就是不明不白的数据被留下来。

很多人跟我说阿里巴巴数据很有值钱,我听着就很郁闷,为什么郁闷?当你知道一个数据值钱的时候,这个数据就不值钱了。数据的魅力在于,你不知道今天它能干什么,明天它就帮你很多,这是数据非常有意思的地方。这是互联网进步带来的,今天所有的技术进步带来的。

我们讲数据是最不值钱的,值钱都是信息,还有一个东西更值钱,是智慧。为什么数据这件事情在这个时代变得重要,是因为所有人过去以为找到金子就会发财,但到了互联网时代,实际上找到沙子是让你发财。在互联网时代不是去找金矿,而是找到把沙子变成金子的方法,这是真正的价值。

如果假定互联网是基础设施的话,数据就是个新的生产资料,它的价值与土地一样,没有办法直接判定它是否存在价值,直到有人去开荒、盖房子。数据其实就是如此,它对社会的价值远远超出过去。当然,这个生产资料跟所有生产资料有不一样的地方,用户需要用自己的方法找寻到它的价值。

三、关于计算:新型公共服务

计算为什么很重要?这么多年有个感受,特别是在过去五六年讲云计算的时候,我觉得云讲得太多了,而计算讲少了。我认为云只不过是计算的一种方法,真正产生社会价值的是计算。刚才我分享数据是没有价值的,直到有一天被计算时才会发挥价值,所以可见,计算在此之中起着非常核心的作用。

以Google为例,它将世界上每个人到今天为止都可以拥有的数据作为最重要的生产资料。到今天为止,这个财富不单属于哪一个人,而是在座每个人的,它只不过是每个人都有的数据积累。而Google的优势在于它有足够便宜和多的计算能力,使得它开始做“搜索”,其实就是这么简单,这也是我们可以认真反思的高性能计算所在。

倒过来讲,谷歌靠什么地方挣钱?大家都说是广告,我则不以为然。当有PC开始,有个东西叫鼠标,当时我在微软做一个项目,今天说“Big Data”,那时候还不知道此为何意。以前的软件公司与今天物联网硬件公司一样,卖出十几亿份的Windows、Office,但是它悲惨的是从来不知道这个软件在真实世界是如何被人使用的,它让几百人甚至上千人做测试,将数据搜集起来,其实只是搜集信息,大概知道你怎么用软件的,却根本不知道最后交付到用户手里是如何使用的。它推出一个“用户体验改进计划”,其实已经拿到了数据,但它想做的只是为了改进软件,所以此数据非彼数据。

鼠标点击最早能看到的那家公司叫微软,但是Google做了什么事情?就是一个点击没有意义,但当有万万亿点击,同时又有足够的计算能力,而这个计算能力又足够便宜,你能够猜得出商业意图,这时候就变成财富了。所以今天,Google就做两件事情,一是将所有的数据用它的计算能力变成它的基本竞争力,其二是把大家觉得不值钱的事情,就是地上留下的脚印,变成它的财富。所以即使给你数据,你也算不准它的商业意图。

大家可以想想看,你消耗掉多少计算?单位计算成本是多少?如果你不消耗计算,就像最后石油的价值是炼出来的,不是挖出来的。同时,炼油的成本远远高过最后出来的东西给社会带来的价值,这个生意也做不下去了。因此,计算变得非常重要,只不过有人是用计算的方法,计算在未来会变成什么样子,一定会是公共服务。

这是我自己理解的云计算。如果三句话连在一起,就是互联网成为了基础设施,数据成为了生产资料,计算要成为公共服务。从产业角度来讲的话,大家都知道电的发明,包括今天交流电的发明其实都不在美国,都在欧洲的,但是把电变成一个公共服务是发生在美国的,这是美国那一场工业革命非常有意思的地方。所以如果我们通过努力,能够把计算真正变成公共服务,对这个产业的价值是巨大的。如果数据要真正成为全世界的财富,就像电一样变成公共服务,计算变成公共服务基本没有希望了,如果还是抱一台计算机回去,基本上你的想象空间被那台机器束缚。

今天,计算对人类的价值才刚刚开始,而我们也总算跳出了机器对我们的束缚。将互联网、数据和计算叠加起来,使得一个新的经济模式开始,我管它叫“计算经济”,真正靠计算产生价值。为什么我前面讲到接下来的30年、50年互联网会依旧是创新的东西?七八年以前我们都在讲互联网是世界上最大的一台计算机,但有一个很重要的东西没有到互联网上去,就是人跟人的大脑。只有当人跟人的大脑到互联网上去的时候,一个时代才可以开始。这两个系统不知道在我有生之年能不能看到,但是未来很长时间内我们都有工作可以做,一个是互联网,另一个是人跟人的大脑,这是接下来10年、30年留给我们的空间。

谢谢大家!

本文转载自数据观,转载请注明原文链接http://www.cbdio.com/BigData/2015-12/11/content_4305953.htm

分享到:
热门文章

REmap发布,用R绘制百度迁徙图

2015年07月23日更新 19606次阅读

学习R语言,一篇文章让你从懵圈到入

2016年05月09日更新 13543次阅读

清华大学教授:大数据时代 统计学依

2015年08月07日更新 10964次阅读

在R中填充缺失数据—mice包

2015年12月31日更新 9296次阅读

精通 R plot—第一部分:颜色

2016年01月20日更新 7786次阅读

非统计学专业的人该如何学习 R 语

2015年07月24日更新 7741次阅读
热门课程

R语言初级课程

2015年02月20日发布 3096名学员

R语言高效数据清理工具包dplyr

2015年08月30日发布 1624名学员

R语言数据分析入门

2016年05月10日发布 1464名学员

如何用R做数据预处理

2016年06月03日发布 1124名学员

全栈数据工程师养成攻略

2016年11月08日发布 976名学员

R语言大规模数据分析实战

2015年12月17日发布 933名学员
登录 注册