Nate Silver[美]纳特•西尔弗
读书笔记
信号与噪声
预测是什么
预测是本书的中心问题,同时也是信息过载的一个解决方案。预测在生活中必不可少,每次我们选择工作方法,决定是否要投资,都是对未来事情的预测。预测是人们的共同事业,而不仅仅是一些从业者或相关专家的职责。预测永远无法完全准确,因为带有主观色彩,同时预测的目的,是追寻客观存在的真理,所以预测是主观世界与客观世界的连接方式。
大数据时代
1440年,约翰内斯发明印刷机之后,书籍的成本迅速下降,在印刷机发明的一个世纪内信号与噪声:大数据时代预测的科学与艺术 pdf,书籍的生产规模呈指数型增长,数量增长了近30倍,人类知识随即进入快速积累期。一切的信息都有了更快的传播渠道,到了现在,出现了大数据这个词(也是在各种论坛讲座上出现频率较高的一个词汇),肯锡全球研究所给出的定义是:一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合。
印刷机发明后图书年产量变化图
当信息增长速度过快,若我们的处理能力不足,带来的问题也比较多。20世纪七八十年代的计算机热非但没能推动经济和科学的发展,反而造成了两个领域生产力水平的短暂下降,经济学家讲这种现象称为“生产力悖论”。保罗.克鲁格曼说,“因为大量的理论堆积如山,验证数据少的可怜。” 人们利用计算机制作粗略的模型,大胆的预测,但在精度和准确度上都差强人意。 另一个方面,人们会按照自己的意思解释一切实务的原因,不论这些事物的真实情况是否如此。所以人们很难从干扰的噪声中分辨出有用的信号,数据展示的都会是我们想要的结果,而且我们也通常会因为这些结果而轻易地皆大欢喜。
贝叶斯定理
本书主要介绍了贝叶斯定理这种预测理论,即"条件概率"(Conditional probability),就是指在事件A发生的情况下,事件B发生的概率,用P(B|A)来表示。
公式为 P(B|A)=P(A∩B)/P(A),P(A∩B)=P(B|A)*P(A)
同理有 P(A∩B)=P(A|B)*P(B)
由上面两式可得 P(B|A)*P(A)=P(A|B)*P(B)
变形: P(A|B)=P(B|A)*P(A)/P(B)
贝叶斯定理与其他统计学推断方法截然不同。它建立在主观判断的基础上,也就是说,你可以不需要客观证据,先估计一个值,然后根据实际结果不断修正。
贝叶斯定理
我们把P(A)称为"先验概率"(Prior probability),即在B事件发生之前,我们对A事件概率的一个判断。P(A|B)称为"后验概率"(Posterior probability),即在B事件发生之后,我们对A事件概率的重新评估。P(B|A)/P(B)称为"可能性函数"(Likelyhood),这是一个调整因子,使得预估概率更接近真实概率。所以,条件概率可以理解成下面的式子:
后验概率=先验概率 x 调整因子
这就是贝叶斯定理的含义。我们先预估一个"先验概率",然后加入实验结果,看这个实验到底是增强还是削弱了"先验概率"信号与噪声:大数据时代预测的科学与艺术 pdf,由此得到更接近事实的"后验概率"。
这一理论表明,我们必须从不同角度去思考我们的想法,以不同的方式检验我们的想法,并且坦然面对各种可能性和不确
来源【首席数据官】,更多内容/合作请关注「辉声辉语」公众号,送10G营销资料!
版权声明:本文内容来源互联网整理,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 jkhui22@126.com举报,一经查实,本站将立刻删除。