忘记“大数据”,从“中数据”开始评论Feed 南大通用:行业大数据将超互联网大数据 用户数据泄漏事故调查:印象笔记真的安全吗? * 大数据 + 大数据 * facebook IBM Android 大数据 微软 云安全 NSA app推荐 BYOD 网络安全 Hadoop 大数据应用 首页 » 大数据, 热点 忘记“大数据”,从“中数据”开始 * 大数据, 热点 对于很多市场研究人员来说, “中数据”才是真正能够提供ROI价值回报的分析目标。 而所谓“大数据”分析, 则会呈现递减的ROI。 业界对“大数据”这一概念的质疑声从来就没有停止过,很多人认为它只是一个过度炒作的营销泡沫。确实,单就数据的体量而言,大多数企业并没有Googl e, Facebook那样的PB级数据。 那么, 大数据究竟有没有意义呢? 数据分析专家Tom 数据集在1000万以上的称为“大数据”,而在二者之间的称为“中”数据。 Tom Anderson认为, 在我参加了这个星期的美国营销协会的第一届大数据的研讨会后,我更加坚信了我这几年与许多财富1000强企业的营销人员沟通后的一个看法。 那就是: 大数据,大数据, 大数据, 人们到处在谈它, 其实我发现, 真正处理“大”数据的研究者其实很少。 我认为我们应该把“大数据”的概念范围缩小。 引入一个新的更有意义的名词:“中”数据来描述我们目前的大数据热潮。 要了解什么是“中”数据,进而理解大数据, 我们得先知道什么是“小”数据。 而这两者都不能称之为现在定义的“大数据”。 目前对大数据的定义随着企业对数据的处理水平的不同而不同。通常的的大数据定义指的是用现有普通软件很难分析的数据量。 那么,什么是中数据呢? 进入大数据时代, 有些我们认为是小数据的数据集可能会迅速成长为大数据。 比如 如果我们把同样的文本数据用文本挖掘的方式处理的话,新加入数据集的数据将会极大地增加数据量。 这常常就会被认为是大数据, 它其实只是真正大数据的起步阶段(这与IT经理网之前的文章“大数据需大处着眼,小处着手”中的观点不谋而合)。而且对于这个规模的数据量, 大数据 好了,我们把大数据的一部分切出来叫做“中”数据。 现在, 我们可以重新定义“大”数据了。 为了理解“大”数据与“中”数据的区别, 我们需要考虑一些不同的维度。 Gartner的分析师Doug Laney曾经对大数据有一个著名的描述, 把大数据分为3个维度:规模(Volume), 种类(Variety)和 速度(Velocity), 通常叫做3V模型。 成本(以时间计量或者按照金钱计量)与期望价值构成了所谓的投资收益率(ROI)。 这也可以应用于大数据项目的可行性研究。 相对成本(包括可能从中发现不了什么的风险)来说,并不具有吸引力。 比“中”数据更大的数据量来说, 大数据分析要么并不现实, 普通的商业企业不需要像那样的软件和硬件来进行那个规模的大数据分析。 对撞机的1亿5千万个传感器每秒钟产生4000万条数据。 而实际上, 一提到大数据, 媒体常常提到的是亚马逊, 谷歌或者Facebook。 就算是这些案例中(很多 听上去更像是IT销售鼓吹的科幻小说), 可能意味着发现一些小的人群细分与某些癌症的高风险关联 (参考本站文章: 大数据“显影”:Ayasdi用拓扑数据分析癌症 )从而拯救生命。 * 营销大数据分析市场的十大产品模式 标签: CMO, 中数据, 大数据方法 上一篇«南大通用:行业大数据将超互联网大数据 2. 二十大数据可视化工具点评 9 评 9. 2014年值得关注的十个Hadoop大数据创业公司 3 评 NSA OpenStack twitter web安全 WiFi 云安全 云计算 云计算选型 人工智能 企业2.0 办公app 大数据 大数据人才 大数据创业 大数据工具 大数据市场 大数据应用 大数据案例 大数据趋势 安全意识 安全报告 微软 思科 数据中心 数据可视化 麦肯锡:医疗行业的大数据革命 医疗大数据应用已经来到引爆点,可为美国节省数千亿美元医疗开支。 解读美国国家安全部NSA的大数据战略 棱镜门事件以来,NSA的全球监控行为遭到各国政府和人民的谴责,但美国情报部门所展现的大数据和信息安全技术实力也成为各国政府甚至一流IT 星图数据:电商大数据金矿的“国产挖掘机” 作为为数不多的本土大数据创业企业,星图数据在互联网大数据领域已经耕耘了将近3年,自主研发出了一套适合中国企业的大数据应用服务产品。 * 大数据