惊吗?原来这才是大数据的大问题!

2016-03-04

许多公司已经在积极使用大数据,只是它们没有称之为大数据罢了。虽然大数据一词有诸多争议,可是这项技术还是变得对公司业务来说必不可少。


Dresner咨询服务公司的一项新调查显示,结果发现,没有人知道大数据到底是啥东西;大概同样数量的公司实际上在用大数据处理有意义的任务。


是不是觉得很吃惊?


你应该不会吃惊。毕竟,尽管多年前就有人预言大数据,可是大多数公司仍在努力将小数据充分利用起来。


这倒不是说大数据并不是很重要,也不是说如今许多公司没有从数据中获得重大价值。大数据很重要,许多公司也在从数据切实获得好处。但是,想从大数据获得价值,许多公司首先要变得务实。


谁需要大数据?


正如Datamation杂志的詹姆斯·马奎尔(James Maguire)所写,Dresner咨询服务公司并没有看到大数据大范围采用的现象。




只有17%的公司承认如今在使用大数据,另有47%推迟到未来使用,但何时使用还不确定。如此看来,难怪报告的作者得出结论:尽管经过了长期的造声势和炒作,可是眼下,大数据分析技术的实际部署还是无法广泛适用于大多数企业组织。


大数据,啥也不是?


答案是否定的。毕竟,报告的调查对象中59%又声称,大数据至关重要,尽管明显没有用大数据来处理任何任务。显然这里有某个因素在作祟……


我认为,这某个因素完全是确定性的。


你不断使用那个词……


早在2012年,NewVantage Partners就颠覆了公众对于大数据中的的实际含义的认识。尽管媒体大肆报道PB级数据问题,幕后推手基本上是Hadoop及其生态系统的厂商,但事实上,大多数公司并不存在所谓的PB级数据问题。


正如这项调查所发现的那样,大多数公司面临的主要问题还是数据的种类和速度。



市场终于开始心领神会,将越来越多的资金投入到可以更轻松地管理不同类型数据的技术(比如MongoDBNoSQL数据库和DataStax版本的Cassandra),以及处理流数据的技术(比如Apache Spark)


与此同时,企业继续求助于更传统的数据基础设施,比如甲骨文数据基础设施。正如DB-Engines2015年年底盘点中发现的那样,就总的人气而言,甲骨文是去年提升幅度最大的厂商(从发布岗位、技术论坛提及率和谷歌搜索等方面来衡量)


超过风头甚劲的NoSQL,超过云优先的亚马逊,超过其他任何厂商或技术。


当然,甲骨文的这种人气抬升一方面与大数据毫无关系,而是缘于管理整齐的行列数据。但是从NewVantage Partners的调查数据来看,这种比较的数据仍是大多数大数据分析技术的处理对象。


另外抛开这种结构化数据,我怀疑许多公司仍没有认为多种多样、高速度的数据是大数据。这可能是很少有公司声称在用大数据处理许多任务的一个原因。正如MySQL数据库工程师贾斯汀·斯旺哈特(Justin Swanhart)所说:大数据毫无意义。你还不如问别人他们想要什么颜色的数据库。


简而言之,大数据活蹦乱跳,但是许多公司未必认为它是大数据


那又如何?


对于正在想自己是不是被大数据甩在后头的企业来说,现在别再瞎担心了。正如Gartner的分析师尼克·霍德克(Nick Heudecker)所说,大数据已迁移到更熟悉的类别:


先进分析和数据科学


商业智能和分析


企业信息管理


内存中计算技术


信息基础设施


大多数企业已经在搞充分利用大数据的项目,它们只是根本没有称之为大数据。即使如此,还是有大量工作要做。正如麻省理工学院斯隆学院数字商业中心的研究员迈克尔·施拉格(Michael Schrage)所说:


预测分析最深远的影响不是来自从数量上改进预测的质量,而是来自从根本上改变企业组织考虑问题和机会的角度。


换句话说,许多公司可能已经拥有将大数据充分利用起来的必要技术。它们缺少的是,渴望从根本上改变将那些数据充分利用起来的方式。有一群分析员解读数据是一回事,利用那些分析结果、促动公司业务的实时变化是另一回事。


这不是你从某家厂商所能买到的那种东西。它一定需要在企业的DNA内部发生变化。既要更准确地了解大数据,又要用大数据切实处理一些任务,企业确实面临艰巨的任务。