首席数据官

Hi, 请登录

大数据人工智能时代你跟上步伐了吗?(号称第四次技术革命)

大数据人工智能时代

大数据时代

1.世界四次工业革命

讲到大数据人工智能不得不提起世界著名改变时代的工业革命。大数据人工智能是继蒸汽机,电力,信息互联网后的第四次技术革命。著名的工业革命详情如下:

第一次革命:18世纪60年代英国发起的蒸汽技术革命,以蒸汽机为代表。

第二次革命:19世纪中期,以欧洲国家,美国,日本发起的电力技术革命,以1866年德国西门子发明的发电机为代表。

第三次革命:20世纪四五十年代,世界各个国家发起的计算机及信息技术革命,以计算机,航天技术,原子能为代表。

第四次革命:21世界初,以大数据人工智能为代表的全新技术革命。2016年3月9日-15日阿尔法狗大战围棋大师李世石开始爆发。

2.大数据与人工智能

好多人对于新技术完全不能理解,我简单谈谈我的个人理解,关系图如下:

大数据时代

首先大数据是人工智能的基础,没有数据就没有人工智能。只有通过海量的数据分析,利用才会实现人工智能。其次实现人工智能需要有机器学习,深度学习的高深莫测的技术。

(1)机器学习和深度学习

机器学习:抵达AI目标的一条路径

机器学习就是用算法真正解析数据,不断学习,然后对世界中发生的事做出判断和预测。研究人员会用大量数据和算法“训练”机器,让机器学会如何执行任务。

深度学习:实现机器学习的技术

“人工神经网络(Artificial Neural Networks)”是另一种算法方法,神经网络(Neural Networks)的构想源自于我们对人类大脑的理解——神经元的彼此联系。

3.大数据经典案例(1)啤酒与尿布 全球零售业巨头沃尔玛在对消费者购物行为分析时发现,男性顾客在购买婴儿尿片时,常常会顺便搭配几瓶啤酒来犒劳自己,于是尝试推出了将啤酒和尿布摆在一起的促销手段。没想到这个举措居然使尿布和啤酒的销量都大幅增加了。如今,“啤酒+尿布”的数据分析成果早已成了大数据技术应用的经典案例,被人津津乐道。

(2)微软大数据成功预测奥斯卡21项大奖 2013年,微软纽约研究院的经济学家大卫罗斯柴尔德(David Rothschild)利用大数据成功预测24个奥斯卡奖项中的19个,成为人们津津乐道的话题。2014年罗斯柴尔德再接再厉大数据时代,成功预测第86届奥斯卡金像奖颁奖典礼24个奖项中的21个,继续向人们展示现代科技的神奇魔力。4.大数据三大分布式计算系统

对于数据量庞大,普通架构很难或者说处理出来结果很慢。而我们需要快速高效的处理数据,对数据进行分析,得出有价值的结果。所以有了大数据技术,并且在离线和对数据实时处理上都有相关成熟技术。有待我们深入研究学习。

Hadoop:离线的复杂大数据处理,存储在硬盘上。

Spark:离线快速的大数据处理,存储在内存上。

spark streaming实时大数据处理。

Storm:在线的实时大数据处理,存储在内存是上。

5.Hadoop介绍(1)hadoop组件

MapReduce:分布式计算大数据时代,对数据进行切割,计算,合并。(处理数据最核心的分布式计算框架)

HDFS:分布式存储。

Yarn:集群资源管理系统。

(2)MapReduce分布式计算介绍:

大数据时代

如上图可以看出来,分布式计算的核心框架MapReduce是分为map端 和reduce端。map端是对数据进行分割,reduce端是切割后的数据片进行合并,最终得到自己想要的结果。

6.spark介绍

Spark是开源的类Hadoop MapReduce的通用的并行计算框架,Spark基于map reduce算法实现的分布式计算,拥有Hadoop MapReduce所具有的优点;但自身还有一个优势:rdd(弹性分布式数据集)。

RDD 只读、可分区,这个数据集的全部或部分可以缓存在内存中,在多次计算间重用。 所谓弹性,是指内存不够时可以与磁盘进行交换。这涉及到了RDD的另一特性:内存计算,就是将数据保存到内存中。

7.storm介绍

Storm是自由开源的分布式实时计算系统,擅长处理海量数据,适用于数据实时处理而非批处理。

storm核心概念:

Nimbus:Storm集群主节点,负责资源分配和任务调度。我们提交任务和截止任务都是在Nimbus上操作的。一个Storm集群只有一个Nimbus节点。

大数据 云时代_时代大数据时评_大数据时代

Supervisor:Storm集群工作节点,接受Nimbus分配任务,管理所有Worker。

Worker:工作进程,每个工作进程中都有多个Task。

Task:任务,每个Spout和Bolt都是一个任务,每个任务都是一个线程。

Topology:计算拓扑,包含了应用程序的逻辑。

Stream:消息流,关键抽象,是没有边界的Tuple序列。

Spout:消息流的源头,Topology的消息生产者。

Bolt:消息处理单元,可以过滤、聚合、查询数据库。

Stream grouping:消息分发策略,一共6种,定义每个Bolt接受何种输入。

Reliability:可靠性,Storm保证每个Tuple都会被处理。

8.大数据人工智能成熟产品(1)京东无人机

2016年6月8日上午9点,在江苏宿迁市曹集乡同庵村居委会首次使用。

试看结束,如继续查看请付费↓↓↓↓
打赏0.5元才能查看本内容,立即打赏

来源【首席数据官】,更多内容/合作请关注「辉声辉语」公众号,送10G营销资料!

版权声明:本文内容来源互联网整理,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 jkhui22@126.com举报,一经查实,本站将立刻删除。

相关推荐

评论

  • 昵称 (必填)
  • 邮箱
  • 网址
二维码
评论