Tag Archives: BigData

[转]数据分析的3个层次

原文地址:http://f.dataguru.cn/thread-53698-1-2.html 数据分析,有3个层次: 第一层次 业务主导,业务人员根据他们的经验提出一些变量和阈值,然后由IT人员进行query、汇总,数据分析师的角色就是制作图表。这种分析,其实就是极其简单的决策树。 阈值的决定基本是拍脑袋的,连决策树实现最佳分离度都不用。 第二层次 业务人员能看出数据的问题,但说不出道理,也想不出该找哪些变量,因为关系太复杂,超出他们的认知,这时数据分析师可以介入,用数学手段抽象出模型,这个层次是分析师最喜欢的,因为有成就感,而且一般是肯定能做出来的(因为业务人员可以判断)。 第三层次 业务人员完全无法提供先验知识,这时数据分析师可以自由在数据的天空里翱翔,用各种机器学习的手段进行各种数据挖掘,找出有趣的东西,这个层次是业务人员最不喜欢和抗拒的,因为没他们什么事情。 1可以理解为业务人员的地盘,3可以理解为数据分析师的地盘 3这块,失败率是很高的 其实最好做的还是属于2这块的项目,1的话,体现不出分析师的价值,不好叫价 数据分析师都幻想着3,但实际上大部分时候在1 ,这会让分析师们觉得是失落!理想和现实的落差啊! 业务人员对3是不屑的,他们觉得在遍地都是黄金可捡的时候为啥要去打个100米深的洞找金子?因此往往会将其归结为不切实际的幻想,学究,纸上谈兵等等。 实际的推进,往往是1和2都收拾的差不多没啥油水了,才会去做3。  

谁是大数据的受益者?

原文地址:大数据,香饽饽还是烫手的山芋? 文章的标题不太好,其实主要说一般的企业如何认识大数据,大数据和传统BI的关系。主要的观点如下: 一些专家认为,除了大量的研讨会,还有各类公司宣称进军大数据领域的雄心,其实际进展至今难见成效。许多企业CIO认为,国内能利用大数据背后产业价值的行业主要集中在金融、电信、能源、证券、烟草等超大型、垄断型企业,其他行业谈大数据价值为时尚早,大数据在企业的运用并不是说只要开放了数据、运用一些技术就可以轻易地发现“金矿”。目前国内大数据应用似乎正在呈现这样的状态:投资人活跃,技术和服务供应商热心,数字媒体高调,而大量应用企业迷惑。   当前IT厂商心态日趋浮躁,急功近利,没有真正去认真研究客户需求、认真研究企业管理,而是还停留在炒作概念甚至捞一把就走的阶段。今天你一个SOA,明天我一个EAI,今天你来网格计算,我明天来个云计算,你一个BI,我来个大数据,等等。   大数据与BI二者之间存在着深厚的天然联系,一对孪生兄弟,它们办公决策工作本身都是一种团队协作和协调,尤其是在数据挖掘和数据分析层面,并没多大的差别。同时,传统BI与大数据的关系,并不是互相替代、排斥的关系,它们犹如人的左脑和右脑,分工不同,传统BI以处理结构化信息为主,大数据以处理非结构化、半结构化信息为重,它们相互依存、相互补充、共为一体,组成企业完整的信息化大脑。 个人理解大数据应用方面宣传的产品推荐、用户行为分析等案例,属于数据分析中的高阶数据挖掘应用,更偏重于机器学习和预测性的分析,而这方面的分析无疑是需要大量的历史数据支撑,因此对大数据的处理能力更显得重要。