您当前位置:经济网 >> 智慧城市 >> 城市动态 >> 浏览文章
  • 城市动态
  • 大数据之 大

    时间:2015年02月02日 信息来源:经济网 作者:陈 晨 点击: 【字体:

    大数据之 大

        人们对于“大”的追求始终是孜孜不倦的,这可以从语言符号中找到一些影子——强大、壮大、宏大。“大”象征了充足、丰富以及更多的可能性与发挥空间,放到今天的数据命题上,“大”同样发挥了类似的作用。数据的意义对于人类来说接近于天空、海洋以及宇宙,对数据的开发可以说是在另一维度上的探索,那就是增进我们对自身的理解,此时,再冠以“大”字,无疑在预示着新航程的开始。
     
    ·大量·
     
        比特(BIT)的出现让我们能够将计算机所产生的数据进行量化,这是人们在信息技术上实现突破的基础,按照大数据4V特征(Volume、Velocity、Variety、Veracity,大量、高速、多样、价值),大数据首先应该具有的就是数量上的巨大。
     
        一种被大多数专家认可的大数据体量标准是,目前主流软件工具无法在合理时间内撷取、管理、处理、并整理成为帮助企业经营决策的资讯数量级。也正是由于这样的划分,在当前涉及到大数据运用的实例中,“并行计算”技术成为3大数据运作的主流。具体到数量级上,麦肯锡对外宣传一般是指突破传统数据库有效工作的数据在10—100TB(百万兆字节),国际数据公司(IDC)也将标准设立在100TB,因此10—100TB通常成为大数据的门槛。
     
        “当前,全球的数据总量正呈指数增长,过去3年间产生的数据量超过了以往的总和。赛迪智库软件与信息服务业研究所所长安晖告诉记者,移动互联网、物联网等的迅速发展,使新数据源不断出现,GPS、传感器等数据持续大量产生。而数据获取成本、存储成本和处理成本的下降,也推动了数据量的膨胀。”
     
        对此,国务院发展研究中心研究员李广乾在接受《智慧城市》记者采访时谈道:“今天中国很多企业、地方政府都在筹备自己的大数据中心,虽然严格来说这还不能算是大数据,但是中国市场所展现出的活力在大数据领域下的价值是不可否认的。”在他看来,数据的量取决于产生、采集、维护等多方面内容,“大量”只是一个相对概念,能够切实指导决策、发挥数据作用才是我们使用大数据的目的。
     
        同样,前雅虎中国总经理谢文也表示,单纯数量上的庞大并不是支撑大数据的意义所在,“在地球任意地方捡起一块石头,都可以验出铁元素,但是,说世界遍地都是铁矿一定是胡扯。只有石头中铁含量超过一定比例,而石头数量又达到相当规模,这堆石头才能被称为铁矿,人们才会对它产生投资开采的兴趣”。之于大数据亦是这个道理。
     
    ·大视野·
     
        人类的每次技术革新都可以被视为自身能力的延展,或者是能力的进化。人们憧憬肋下生出双翼遨翔天空,于是发明了飞机;梦想用超过双腿的速度移动而发明了汽车。同样大数据技术的革新也将是一次跨域式的延展,只不过这一次目标选取在了眼睛上。
     
        大数据在通常意义上讲可以被分为两个部分,一是前文提到的海量数据的存储运算,二是数据的建模运算。后者实际上是大数据能够产生价值的核心。两部分的关系用计算机硬件来比喻的话,类似于硬盘和CPU(中央处理器)。物联网的推广扩大了数据储备的基数,并最终产生了量变,数据的拥有者可以在挖掘中找到共性和规律,再辅以传统数学建模分析,从而让人们拥有了更宏大的视野。通过浩瀚的“1”和“0”,我们可以看到顾客的购物偏好,可以看到上网者的查询规律,甚至跨越视觉维度预测未来的趋势,这就是大数据的力量所在。
     
        “信息技术领域原先已经有‘海量数据’、‘大规模数据’等概念,但这些概念只着眼于数据规模本身,未能充分反映数据爆发背景下的数据处理与应用需求,而‘大数据’这一新概念不仅指规模庞大的数据对象,也包含对这些数据对象的处理和应用活动,是数据对象、技术与应用三者的统一。”安晖说道。试想,如果一家超市能够了解一定范围内所有居民的购物习惯,那么它就可以通过调整货架上的商品来实现更加丰沛的利润。同样,一个股民如果能够了解所有投资者对于股市的预期,那么他就可以度量什么时候进入股市风险最小。
     
        要在今天实现以上两个例子虽然仍需要巨大的物力、财力、技术人员支撑,但这确实是大数据正在做的事情。《智慧城市》记者从官方公布的数据中了解到,亚马逊超过三分之一的销售额来自于对用户的个性化推送系统,而该系统日常运作的主要依据就是客户购买、浏览商品的习惯和偏好,尽管收集的数据是否达到100TB我们无从得知,但在眼下,大数据理念确实在很多领域实现了商业价值。
     
        此外,在我们使用搜索引擎查询之后,系统也会保留我们的搜索关键热词,并在部分网页上进行推送。通过观察记者发现,这其中一部分链接甚至可以直接进入相关产品的网店。
     
        在谢文看来,这其实仍然不能被称之为大数据,“海量搜索数据虽然规模庞大,但结构简单。在数据挖掘深度、搜索结果个人化、搜索结果与广告之间的相关度上进展有限。这样的记录模式在安全性上也还存在争议”。但他也承认,这种节点数据的收集的确为未来大数据的使用提供了一种可能,让我们在未来做某件事时能够拥有更加宽阔的视野,更好地把握环境局势。
     
    ·大作为·
     
        如果说大数据只能提供一种可能性,那么其自出现之初便广受诟病也就无可厚非了。但与此同时我们也不得不承认,随着这一概念的发展,最先被人们接受的大数据思维正在悄然改变着当前的生活。就好像原始时期人们用并不锋利的工具进行切割,虽然切割效果未必理想,可随着工具加工技术的提升,这种理念终究会转化成为巨大的生产力变革。
     
        美剧《纸牌屋》的走红就与大数据密不可分。从影片内容上讲,政治斗争的题材并不算新颖,社会构架上也没有明显的新意,但是其上映后,《纸牌屋》的出品方兼播放平台Netflix在新一季度就增加了超过300万流媒体用户,股价上升了26%,这其中主要得益于大数据思维的运用。为筹备新剧,Netflix构建了一个专门的数据库,这其中包含3000万用户的收视选择、400万条评论、300万次主题搜索。最终,拍什么、谁来拍、谁来演、怎么播,都是由数千万观众投票决定的。从受众洞察、受众定位、受众接触、受众转化,到一季剧集一次性公映的播放方式,每一步都是由精准、细致、高效的数据作引导,从而实现了大众创造的C2B,即由用户需求决定生产。
     
        也许发展到今天的大数据还不能如最初预想的那样指引我们的生活走向更美好的未来,但是也正如安晖所说,“大数据是信息技术与专业技术、信息技术产业与各行业领域紧密融合的典型领域,有着旺盛的应用需求、广阔的应用前景。为把握这一新兴领域带来的新机遇,需要不断跟踪研究大数据,不断提升对大数据的认知和理解,坚持技术创新与应用创新的协同共进,加快经济社会各领域的大数据开发与利用,推动国家、行业、企业对于数据的应用需求和应用水平进入新的阶段。”
     
     
    文章热词:
    延伸阅读:
  • 官方微信
  • 智慧应用
  • ​智能交通系统是在道路交通基础设施、城市公共交通、道路运输系统上建立的以信息采集、处理、融合、交 [详细]