对于数据科技生产力

大数据正在经历从看到用、从说到做的历史拐点。
读《决战大数据:驾驭未来商业的利器》的前言有种奇怪的感觉。一般来说,序言是作者交待写作动机、阐明主要内容,并对各类师长朋友同事表达感谢的文体。而车品觉为这本书所写的前言一上来就要人“忘掉大数据”——按理说,不是应该强调大数据的趋势重要性、对企业的战略作用更常见的吗?
不妨看看车品觉是怎么写的:“大数据的概念纷繁复杂,媒体上充斥了各种关于大数据的报道,但其中不乏牵强附会、滥竽充数的言论,某些媒体甚至把简单的统计也冠上了‘大数据’的头衔”。所以目前人们最应该做的,“就是暂且忘记大数据的概念”,因为“行胜于言,只有具备实效性的数据才是正道”。车品觉试图告诉每个人大数据的具体运作应该是什么样的,而且数据量绝对不是一个最重要的理由,我们要的不是数据的量,而是有“质”的量。如车品觉所言,这便是他写作《决战大数据》一书希望有的效果。
所以这就不难解释,为什么在书的正文第一章,当我们想当然地以为会是“何谓大数据”等类似入门、启蒙的章节时,车品觉却直奔主题、一针见血,讨论“大数据,为什么很多人只会谈,不会做”。能有如此论调或写出这样文字的,多半来自业界一线;也只有真正做过大数据,用过大数据的,才有底气谈大数据以及“如何成为决胜未来的商业利器”。
本书的作者车品觉,现任阿里巴巴集团商业智能部副总裁、数据委员会会长,拥有十几年丰富的数据实战经验。可以想见,自身长期的从业经历,加之互联网巨头阿里巴巴的事业平台,车品觉对大数据认识的角度、高度和深度自然不同寻常。就拿相关作品来说,在前有维克托·迈尔·舍恩伯格的《大数据时代:生活、工作与思维的大变革》开启了“大数据商业应用之先河”,后有涂子沛从历史文化提出“数据时代的到来”的《数据之巅》,同时还有被称为“大数据商业应用的引路人”的大卫·芬雷布的《大数据云图》、埃里克·西格尔的《大数据预测》,以及讲技术算法和统计思维的Anand Rajaraman写的《大数据:互联网大规模数据挖掘与分布式处理》、冯启思(Kaiser Fung)的《数据统治世界》等。这意味着,要再写一本大数据话题之作,很不容易。
《决战大数据》的一个主要看点是阿里巴巴的大数据实例——它做了什么,又是怎么做的?身为阿里数据委员会的“家长”,车品觉的言行势必会引起业界同行的关注。其实早在该书出版前,车品觉或多或少就阿里的大数据战略与策略向外界透露过。譬如在2013年下半年某一期的杂志上,车品觉就向记者表示:“一开始,我们在用好数据,但是随着数据战略与平台战略紧密结合,我们开始刻意地去管理数据(保证数据安全、质量和对于商家的可用性),养数据(有意识地收集外部数据),沉淀数据。”在谈及“如何将大数据用好”转变为“让大数据更好用”的理由上,阿里巴巴又是从以下六个地方入手的:确保数据安全(保护商家和个人的隐私)、保证数据的质量(去除虚检测数据)、实现各个部门数据标准的统一(如转化率)、让原始数据变得更精细化(更符合商家的应用情景)、获得外部数据(如并购新浪微博、收购高德地图,和其他平台合作、购写数据信息等)、建立数据委员会。
时间再往前推,2012年,马云正式公布了阿里巴巴三步走的发展策略,即“平台、金融、数据”,这意味着阿里巴巴誓要转型成为一家“互联网数据公司”;2011年,“页面点击”诞生,它可以监控每个页面上每个位置的用户浏览点击情况。紧接着,天猫携手阿里云、万网宣布联合推出聚石塔平台,为天猫、淘宝平台上的电商及电商怎么写作商等提供数据云怎么写作;2011年,阿里巴巴开发数据魔方,通过淘宝数据魔方平台,商家可以直接获取行业宏观情况、自己品牌的市场状况、消费者在自己网站上的行为等情况;2009年,阿里巴巴的大数据应用开始走向外部,让淘宝商户分享数据;2005年,阿里巴巴就意识到数据时代的到来,开发了专门供内部运营人员使用的数据产品——淘数据,公司员工可以利用平台海量的消费者和商家数据,来完善自身经营状况。当然,这还不包括阿里旗下基于大数据理念、布局互联网金融的“牛刀小试”作品——阿里小贷。
到了《决战大数据》,车品觉的思路更为清晰、深入,而阿里巴巴的大数据做法也被首次系统地阐述。在这其中,车品觉细化了马云当年提出的“数据化运营”和“运营数据”两个概念,换言之,当人们谈起大数据实践时,至少在阿里巴巴企业内部,它是分为以上两步展开的。所谓数据化运营,简单讲就是使用数据帮助企业/客户解决理由;而运营数据就是在原有的数据基础上,搜集、整理、分析,进而产生新数据的过程。对此,车品觉分别以“用”和“养”两个精准的动词来区分。
紧接着,车品觉用“混、通、晒”来归纳数据化运营,并描述成“内三板斧”,而用“存、管、用”来总结运营数据的“外三板斧”。车品觉指出,作为一名卓有成效的数据分析师,如果不和业务部“混”在一起,商业敏感度就无从谈起。坚持带着业务理由来观察数据或者带着数据来观察业务,兼备二者的敏感,就做到“通”,更深层次的通是存在于公司组织中的数据(部门和部门之间的数据分享)。数据能不能做到在获取、使用、分享、协同、连接、组合之上让自己变得超级简单和便捷,这时数据化运营里面非常重要的一点,正是“晒”的内容。与此同时,“存”是指积极地收集数据,但这不是根本目的,让收集起来的数据如何产生价值才是最终的目的;学会用数据产品来解决获取及使用数据的理由。“管”不仅仅是把收集来的分类、存储那么简单,阿里巴巴数据管理最不一样的地方(也可以算作“竞争力”体现)在于非常依赖数据产品,希望用数据产品来解决获取以及使用数据的理由。在“用”数据的理由上,通过数据的分裂和重组,来实现颠覆性创新。
在今年召开的一次“西湖品学”大数据峰会上,车品觉和与会者分享了一个有趣的发现。他说,纵观这几年美国O'Reilly媒体公司举办的Strata大会(美国大数据技术会议)的主题词演变,你就可以看清世界大数据的发展趋势。2010年是“Data”,2011年是“Talk Big Data”,2012年是“Apply Big Data”,2013 年是“Data Engineering”。——车品觉特别强调了最后一个用词的变化:Data Engineering(数据驱动)。他认为这是大数据从看到用、从说到做非常重要的一个历史拐点。结合他在《决战大数据》中总结的“数据十戒”中的第二、第三条,即“在实践中提炼数据”和“让数据变成科技,惠及更多人”。他的理论核心再清晰不过:让数据科技(Data Technology)成为一种生产力!
(作者杨吉,法学博士、浙江传媒学院网络与新媒体专业系主任)

相关论文

置信关联数据挖掘在股票中和运用科技

摘要:数据挖掘又被称为数据库知识发现,它是以数据源(如文本、图片、万维网、数据库等)中寻找有用的方式的历程。该方式必须是具有潜在的。
浏览量:14419 点赞量:5011

生态生产力和科技生态化转向

多年来,我们一直把生产力定义为:人类征服自然、改造自然并从自然界获得物质生活资料的能力。这种观点将自然放在人类的对立面,认为人类是自。
浏览量:20233 点赞量:5763