本书出版2013年
20210311
前言:
1、大数据与云计算是一个问题的俩面:一个是问题,一个是解决问题的方法。
2、通过云计算对大数据进行分析、预测,会使得决策更为精准,释放出更多数据的隐藏价值。
3、大数据发展的障碍,在于数据的“流动性”和“可获取性”。
4、人们的观念应该从数据的因果关系转变成相关关系上。
5、本书推出的理念:一要全体数据不要抽样数据、二要效率不要绝对精准、三要相关性不要因果关系。
6、当下大数据的担忧:产业生态环境、数据安全隐私、信息公正公开等。
7、瑞士日内瓦的强子对撞机,由此捕获了人类有史以来最大规模的单位时间数据。
20210312
大数据,变革公共卫生
1、1918年“西班牙流感”导致10亿人(当时世界人口17亿)感染1000w人死亡,流感起源美国一位0号病人,处于一战时期,新闻管制,所以只有西班牙播报疫情,才取名“西班牙流感”。
2、甲型H1N1流感《大数据时代》,谷歌公司通过观察人们在网上的搜索记录来完成预测传播时间和地点,因谷歌有其他公司所没有的庞大数据资源、处理能力和统计技术。
大数据,变革商业
1、奥伦.埃齐奥尼(oren etzioni)是美国计算机专家,担任华盛顿大学AI项目负责人,发现机票价格不合理性。
2、埃齐奥尼先是从旅游网站上在41天内爬取12000个价格样本数据,但无法预测价格走势,他命名为“哈姆雷特”;
3、埃齐奥尼根据美国商业航空产业中每一条航线上每一架飞机内的每一个座位一年内的综合票价记录而取得2000亿条飞行数据记录,来预测价格走势,同时标示出来可行度数值;
4、埃齐奥尼并把此系统运用到宾馆预订、二手车购买等。
大数据,变革思维
1、数据已经是一种商业资本,一项重要的经济投入;
大数据,开启重大的时代转型
1、2003年,人类第一次破译人体基因密码,完成了三十亿对碱基对的排序。十年后,世界范围内的基因仪15min就完成同样的工作。
2、拍字节,1PB=250
艾字节,1EB=260
泽字节《大数据时代》,1ZB=270
1兆=1024KB
3、谷歌公司每年处理超过24PB数据,这意味着每天的处理量是美国国家图书馆所有纸质出版物所含数据量的上千倍。
4、Facebook每日更新pic超过1000万张,每日人们点击“like”or写评论大约有30亿次;
5、谷歌子公司YouTube每月接待多达8亿访客,平均每秒就有1h以上视频上传。
6、Twitter每年信息量翻一番,截止2012年,每日发布4亿条信息。
7、南加利福尼亚大学安嫩伯格通信学院的马丁.希尔伯特(Martin Hilbert)的一个研究:算出人类所有创造、存储和传播的一切信息的确切数据。
8、2007年全人类数据约300EB,其中7%是模拟数据,其余为数字数据。
9、2000年数字数据只占全球1/4。
10、按照希尔伯特说法,数字数据每三年多会发一番,相反,模拟数据数量基本不变。
11、到2013年,世界存储数据约1.2ZB,其中非数字数据不到2%。
12、人类存储数据量的增长速度比世界经济增长速度快4倍;
计算机数据处理能力的增长速度比世界经济增长速度快9倍。
13、纳米技术:
铜本来是用来导电的物质,但一旦达到纳米级别就不能在磁场中导电了;
银离子具有抗菌性,但一旦达到分子形式存在就不具有抗菌性;
14、一旦达到纳米级别,金属可以变得柔软,陶土可以具有弹性。
15、当我们增加所利用的数据量时,我
来源【首席数据官】,更多内容/合作请关注「辉声辉语」公众号,送10G营销资料!
版权声明:本文内容来源互联网整理,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 jkhui22@126.com举报,一经查实,本站将立刻删除。