1. 企业大数据面临的难题
企业数据系统架构存在的问题
针对企业的数据系统架构,被调查者认为运营成本过高、资源利用率低、应用部署过于复杂和扩展性差这四方面的问题几乎同等重要,其中运营成本过高以27.74%成为被调查者眼中企业数据系统架构最严重的问题。因此,如果企业部署新的大数据解决方案,就应摒弃原系统中的问题,或者改良系统架构,或者推倒重来。
企业面临的数据技术难题
在大数据的影响下,现有数据系统架构的问题日益凸显,在企业面临的数据处理技术挑战的调查中,23.87%的被调查者认为数据读写瓶颈是最大的技术挑战,20.16%选择了数据类型多样化,16.26%选择了存储压力,16.26%选择了系统性能瓶颈。从排名前三位的技术挑战中可以看出,大数据中快速的数据流转(velocity)和多样的数据类型(variety)成为最困扰企业用户的两个关键特性,同样也是最亟待解决的关键问题。
企业数据挖掘和分析面临的问题
关于数据挖掘与分析应用,29.40%的被调查者认为这些应用最大的问题是分析不准确,21.36%的被调查者选择了分析速度慢,18.34%选择了价格昂贵。从这三个方面来看,用户最担心的还是企业花钱部署数据挖掘与分析类应用,却不能通过分析做出正确的决策。
分析的速度也是一个重要的问题。随着企业数据量越来越大,进行一次分析所用的时间也越来越长。起初企业总是利用下班时间跑报表,但这种方式越来越不能满足实时决策的需求,常常会错过商机。因此从软硬件角度优化分析速度,即是企业经营决策的需求,又是数据分析产品新的考察指标。
2. 企业大数据投入现状与规划
企业大数据投入情况
关于企业在大数据领域的投入问题,28.83%的被调查者选择20-49.9万元,27.48%的被调查者选择0-19.9万元,17.57%的被调查者选择50-99.9万元,即56.31%的企业用户对大数据的投入小于50万元。另外,150万元以上的只占13.96%。由此可见,企业对于大数据的投入仍处于初级阶段,并且以Hadoop和NoSQL为代表的大数据基础设施都属于开源产品,硬件方面也可使用廉价的PC服务器,所以投入并不高。
企业大数据的部署规模
从被调查者所在企业考虑或已经部署的大数据节点来看,选择0-5个节点的为40.54%,6-10个节点的为22.07%,11- 20个节点的为16.67%,21- 50个节点的为10.81%,51-100个节点的为2.70%,而101个以上节点的为7.21%。由此可见,大数据的部署还处在初级规模,大多数企业还未部署,或部署少量节点。相信随着数据量的不断增加,大数据相关的节点规模会不断增加。
3. 企业大数据应用趋势分析
企业关注的数据管理新技术
如下图所示,分布式存储与计算成为最受关注的数据管理新技术,比例达到29.86%;其次是内存数据库技术,占到23.30%;云数据库排名第三,比例为16.29%。此外,列式数据库技术、NoSQL也获得较多关注。从调查结果来看,以Hadoop为代表的分布式存储与计算已成为人们心目中大数据的关键技术。以SAP HANA为代表的内存数据库技术和以SQL Azure为代表的云数据库技术,也将成为占据重要地位的数据管理创新平台。
企业如何看待商业智能的未来
对于商业智能未来的趋势预测,调查显示排在前三位的是丰富的挖掘模型、实时的分析、精准的特定目的分析,其比例分别为27.22%、19.88%和19.11%。其后是社交网络分析、云端服务和移动BI。由此看出人们期待商业智能应用能够在这些方面做出改变。