首席数据官

Hi, 请登录

【大数据时代】——数据分析在路上

大数据时代 ——数据分析在路上 大数据时代——[英] 维克托·迈尔-舍恩伯格(Viktor Mayer-Schonberger) [英] 肯尼思库克耶(Kenneth) 著 2013-5-16 Leven 书评: 正如书的标题 A revolution that will transform how we live,work,and think 所说 一样,大数据时代已经到来,它正悄悄改变我们生存的环境,不断地从商业、学习、生活等 各个角度影响我们的行为方式, 在这个快速且复杂变换的信息时代, 我们需要一个更精准的 方法去决策人们的行动, 大数据正在以划时代意义的让人们崛起, 构造一种全新的思维模式, 做更好的决定。 接收新的理念, 那就是从因果关系到相关关系的思维变革, 建立在相关关系分析法基础上 的预测这是大数据的核心。可能我们暂时无法理解全体数据而不是样本数据的处理方法; 不 能理解要效率而不是绝对精准的处理理念; 更不能接受不追求因果这个决定性的关系而去寻 找相关关系的处理导向; 《大数据时代》能告诉你为什么我们要有这样的转变,而这样的转 变能带来多少好处,IBM、谷歌、亚马逊、阿里等这些商业巨头已经开始做了很多成功大数 据处理案例,他们引领我们走向崭新的大数据世界,你还在等什么,数据分析在路上(交流 158328722) 群: 群:158328722 ,我们晃晃悠悠!序 ? 大数据时代处理数据理念上的三大转变:(1)要全体不要抽样 (2)要效率不要绝对精确(3)要相关不要因果 ? 努力在可以应用、可以拓展的地方,应用它、拓展它;在不能应用、不能拓展的地方, 就停下来。

“大数据”时代_大数据 时代 出品时间_大数据时代 数据

引言 一场生活、工作与思维的大变革 ? 大数据是人们在大规模数据的基础上可以做到的事情, 而这些事情在小规模数据的基础 上是无法完成的。 ? 大数据的核心就是预测。它通常被视为人工智能的一部分,或者更确切地说,被视为一 种机器学习。 ? 大数据的核心代表着我们分析信息时的三个转变:(1)在大数据时代,我们可以分析更多的数据,有时候甚至可以处理和某个特别现象相关 的所有数据,而不是依赖于随机采样。 (2)研究数据如此之多,以至于我们不再热衷于追求精确度 (3)第三个转变因前两个转变而促成,即我们不再热衷于寻找因果关系 第一部分 大数据时代的思维变革 —— 不是随机采样,而是全体数据 1. 更多 更多—— ——不是随机采样,而是全体数据 1.1 大数据与三个重大的思维转变有关,这个三个转变是相互关系和相互作用的: (1)首先,要分析与某事物相关的所有数据,而不是依靠分析少量的数据样本 (2)其次,我们乐于接受数据的纷繁复杂,而不是追求精确性 (3)最后,我们的思想发生了转变,不再探求难以捉摸的因果关系,转而关注事物的相关 关系 1.2 随机采样不适合考察子类别的情况,因为一旦继续细分,随机采样结果的错误率会大大 增加。

1.3 全数据模式,样本=总体 1.4 多样性是有额外价值的 —— 不是精确性,而是混杂性 2. 更杂 更杂—— ——不是精确性,而是混杂性 2.1 测量就是认知 2.2 错误并不是大数据固有的特性,而是一个需我们去处理的现实问题,并且有可能长期存 在。 2.3 要想获得大规模数据带来的好处,混乱应该是一种标准途径,而不应该是竭力避免的 2.4 清楚的分类被更混乱却更灵活的机制所取代了 2.5 在大数据里,宽容错误会给我们带来更多价值 2.6 这些传统观念更加基本, 往往被认为是社会建立的根基: 找到一切事情发生背后的原因, 然而其实很多时候,寻找数据间的关联并利用这种关系就足够了 —— 不是因果关系大数据时代 数据,而是相关关系 3. 更好 更好—— ——不是因果关系,而是相关关系 3.1 当数据点以数量级方式增长的时候,我们会观察到许多似是而非的相关关系。毕竟我们 还处于考察相关关系的初期,所以这一点需要我们高度重视 3.2 预测性分析并不能解释故障可能会发送的原因,只会告诉你存在的问题,也就说它并不 能告诉你引擎过热是因为什么,磨损的风扇皮带?没有拧紧的螺帽?没有答案。 3.3 通过因果关系了解世界的两种基本方法(如下) ,大数据之间的关系将会改变他们扮演 的角色 (1)通过快速、虚幻的因果关系 (2)通过缓慢、有条不紊的因果关系 3.4 卡尼曼指出,平时生活中,由于惰性,我们很少慢条斯理地思考问题,所以快速思维模 式就占据上风,因此,我们会经常臆想出一些因果关系,最终导致了对世界的错误理解。

3.5 相关关系分析本身意义重大,同时它也为研究因果关系奠定了基础 第二部分 大数据时代的商业变革 —— 一切皆可 “量化 ” 4. 数据化 数据化—— ——一切皆可 一切皆可“ 量化” 4.1 数据化指一种把现象转变为可制表分析的量化形式的过程 4.2 数字化指的是模拟数据转换成 0 和 1 表示的二进制码,这样电脑就可以处理这些数据 了 4.3“文化组学”是一个计算机专业词汇,指的就是通过文本的定量分析来揭示人类行为和 文化发展的趋势。 4.4 至少现在,可以不失公允地说,亚马逊深谙数字化内容的意义,而谷歌触及了数据化内 容的价值 4.5 公司可以利用大量的位置数据预测交通情况,你也许无法想象,这是通过高速公路上的 手机而不是汽车的数量和移动速度预测出来的 4.6 数据化不仅能将态度和情绪转变为一种可分析的形式,也可能转化人类的行为 4.7“自我量化”是一项由一群健身迷、医学疯子以及技术狂人发起的运动,通过测量身体 的每个部位和生活中的每一件事来让生活更美好——或者至少用量化的方式来获得新知 4.8 一点点的不精确比完全精确 4.9 物理学家们一直宣称情况应该是这样的——并非原子而是信息才是一切的本源 ——“ 取之不尽,用之不竭 ”的数据创新 5. 价值 价值——“ ——“取之不尽,用之不竭 取之不尽,用之不竭” 5.1 验证码全称为全自动区分计算机和人类的图灵测试 5.2 数据的基本用途为信息的收集和处理提供了依据 5.3 不同于物质性的东西,数据的价值不会随着它的使用而减少,而是可以不断地处理 5.4 判断数据的价值需要考虑到未来它可能被使用的各种方式, 而非仅仅考虑其目前的用途5.6 数据的选择价值四种最常见的释放方式:基本再利用、合并数据集、寻找“一份钱两份 货” 、计算数据价值的折旧率 5.7 如果以某种方式收集的单一数据集有多种不同的用途,它就具有双重功能 5.8 公司账目价值和市场价值之间的差额被记为“无形资产” ,早期包括品牌、人才、战略、 渐渐也包括数据 —— 数据、技术与思维的三足鼎立

试看结束,如继续查看请付费↓↓↓↓
打赏0.5元才能查看本内容,立即打赏

来源【首席数据官】,更多内容/合作请关注「辉声辉语」公众号,送10G营销资料!

版权声明:本文内容来源互联网整理,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 jkhui22@126.com举报,一经查实,本站将立刻删除。

相关推荐

评论

  • 昵称 (必填)
  • 邮箱
  • 网址
二维码
评论