数据之舞:大数据与数据挖掘 斯诺登泄露了什么秘密?大数据会暴露隐私吗?什么是数据挖掘? 图片来源:Jason Grow 2012/Human Face of Big Data 于大数据和数据挖掘的讨论“之所以发生是因为我们正处于惊天动地的变革当中,而且我们正以前所未有的方式感知它。”克拉劳尔说。 随着我们通过电话、信用卡、电子商务、互联网和电子邮件留下更多的生活痕迹,大数据不断增长的商业影响也在如下时刻表现出来: 大数据在看着你吗? 除了安全和商业,大数据和数据挖掘在科研领域也正在风起云涌。越来越多的设备带着更加精密的传感器,传回愈发难以驾驭的数据流,于是人们需要日益强大的 在医学领域,2003年算是大数据涌现过程中的一个里程碑。那一年第一例人类基因组完成了测序。那次突破性的进展之后,数以千计人类、灵长类、老鼠和细 大数据盯着“#bigdata”(意为大数据)。这些是在推特上发布过“bigdata”的用户之间的连接,用户图标的尺寸代表了其粉丝数多寡。蓝线表 头脑里的大数据 人脑是终极的计算机器,也是终极的大数据困境,因为在独立的神经元之间有无数可能的连接。人类连接组项目是一项雄心勃勃地试图绘制出不同脑区之间相互作 星系动物园项目打破了大数据的规矩:它没有对数据进行大规模的计算机数据挖掘,而是把图像交给活跃的志愿者,由他们对星系做基础性的分类。该项目200 星系是一个经典的大数据问题:一台最先进的望远镜扫描整个天空,可能会看到2000亿个这样的恒星世界。然而,“一系列与宇宙学和星系统计学相关的问题 我们惊讶地得知志愿者们积累的庞大数据是计算机学习分类的理想材料。“一些星系动物园用户真的很反感这一点。”基尔说,“他们对于自己的点击被用来训练 Big Data 等到处理能力一次相对较小的改变令结果出现突破性的进展,克拉考尔补充道,大数据的应用可能会经历一次“相变”。 “大数据”是一个相对的说法,不是绝对的,克拉考尔指出。“大数据可以被视作一种比率—我们能计算的数据比上我们必须计算的数据。大数据一直存在。如果 1601),当时还没有解释行星运动的开普勒理论,因此这个比率是歪曲的。这是那个年代的大数据。” 大数据成为问题“是在技术允许我们收集和存储的数据超过了我们对系统精推细研的能力之后。”克拉考尔说。 本文编译自:The Why Files,Data Dance, Big Data and Data Mining * “大数据”时代,什么是数据分析做不了的? “大数据”时代,什么是数据分析做不了的? * 大数据时代,我们还有隐私吗? 大数据时代,我们还有隐私吗? 最近出现很多关于“大数据”的文章.......... Big data,how big? 公司也在讨论医疗大数据怎么应用,能不能做出新的产品 曾看过一些大数据相关的研究。不过还是觉得在网络方向上的这类应用,真的尼玛很像曾经看过的一个科幻加玄幻的小说里的易脑! 大数据,从业也两年了。从开始的大数据存储和分布式框架,到现在的大数据挖掘,BI,从简单的存放大数据到现在的理解应用数据。国人对数据的重 最近豆瓣上一个“大数据”引发的吵架已经闹得不可开交了 原来大伙儿都被美帝U盘价格吸引了。。。。不过大数据时代仍然很赞