首席数据官

Hi, 请登录

干货|简单易懂的深度学习指南,不服来辩!(一)

如今大家都在说深度学习

人们往往为技术而兴奋。但深度学习是企业用来解决实际问题的工具。仅此而已, 毋庸夸大,也无需贬低。

在本文中,第一部分将首先将介绍深度学习及其基础,作为我们学习的第一部分。第二部分,我们将介绍 Cloudera 数据和机器学习的统一平台,并展示实施深度学习的四种方法。

最后,我们提供六个实用技巧,帮助您的组织开始进行深度学习。

深度学习:一个成熟的技术

机器学习是一组算法和方法用以发现数据中有用的模式。数据科学家有数百种不同的算法可用,包括:

神经网络是一类机器学习技术。 20 世纪 40 年代由神经科学家开发,以模拟人类和动物大脑的行为,数据科学家在许多不同的业务应用中使用它们。它们包含在一些开源软件库和商业软件包中。

封面

如果具有特定的属性,神经网络是有“深度”的,我们将在下文深度学习 101 中进 行讨论。“深度学习”是指数据科学家用来训练和部署深层神经网络的工具和方法。 这些技术可追溯到20世纪80年代;然而,其应用由于计算复杂性和所需资源而滞后。 降低的计算成本,数字化数据的大量涌现和改进的算法使深度学习在当今变得可行。

深度学习的应用

深度学习成为一个有用的工具是当实践者成功地使用它在诸如文件分析和识别、 交通标志识别、医学成像和生物信息学等领域赢得竞争。当今,数据科学家们将 深度学习应用于各种实际问题:

深度学习是一种成熟的技术,是数字转型的关键驱动力。随着管理人员更多地了 解其成功的应用,对工具和基础架构的需求将会全面激增。

百度 深度学习 研究院_百度深度学习_百度深度学习

深度学习 101

在本节中,我们将简要介绍神经网络和深度学习。有关更详细的处理,请参阅本 文末尾附加阅读部分中链接内容。

数据科学家使用神经网络指定一个问题作为节点网络,或神经元,以分层布置。 定向图将节点彼此连接。数据科学家使用一个优化算法来找到模型的最优参数集, 例如连接节点的边缘的权重。

人造神经网络中的神经元接受来自其他神经元的数据作为输入。他们用数学函数 处理数据以产生计算结果。数据科学家指定神经元应用于输入数据的功能类型。

神经网络节点

图 1:神经网络节点

在人工神经网络中,数据科学家将神经元分层布置。人工神经网络中有三种类型 的层。输入层中的神经元接受数据,而输出层中的神经元呈现模型计算的结果。 神经网络的输入和输出层代表真实世界的事实:输入层表示数据向量,输出层表 示我们想要预测、分类或推断的对象。例如,在图像分类问题中,输入是位映射 图像数据的向量,输出是指示图像表示什么的标签 -- 例如“猫”。

神经网络层

图 2:神经网络层

隐藏层中的神经元执行中间计算。隐藏层是不可直接解释的抽象;它们仅仅用于 提高模型的质量。隐藏层可以使神经网络学习任意复杂的功能。

如果人工神经网络具有两个或更多隐藏层,则它是一个深度神经网络。

深度神经网络

百度深度学习_百度深度学习_百度 深度学习 研究院

图 3:深度神经网络

数据科学家使用术语“架构”来描述指定神经网络的不同方法。有许多不同的神 经网络架构,其特征在于拓扑结构、信息流动、数学功能和训练方法。一些广泛 使用的设计包括:

例如,在图像识别中,一个神经元表示图像中的一个像素。在卷积网络中,该神经元可以连接到代表周围像素的神经元,而不是连接到代表图像的远角中的像素的神经元。

还有许多其他类型的神经网络,包括径向基函数网络、限制波尔兹曼机器、深度 信念网络、深度自动编码器、递归神经网络和堆叠去噪自动编码器。

神经网络中的每个数学函数具有一个或多个参数或权重。参数的数量随模型的大 小和复杂程度而增加;在一个极端的例子中,Cloudera 合作伙伴 Digital Reasoning报告了用 1600 万个参数来训练自然语言处理网络。一个大的计算问题需要一个高效的优化算法,如随机梯度下降或 L-BFGS。

数据科学家通过运行具有训练数据的优化算法来训练神经网络。对于预测和推理 问题,训练数据包括具有已知结果的历史示例。优化算法确定一组预测误差最小 化的参数。

大模型需要大量数据。例如,完成 ImageNet 基准测试的微软团队使用了 130 万张图像的数据。

像所有机器学习技术一样,当组织机构将训练过的模型应用于新的信息时,人工 神经网络可以提供业务价值。数据科学家称之为推论。推论与训练正好相反。在 训练任务中,数据科学家使用一系列广泛的历史样本与已知的结果来估计模型的 参数。推论使用经过训练的模型来预测或者推算未知。

深度学习的利与弊

深度学习有两个关键优势,使其与其他机器学习技术区分开。其中第一个是特征 学习。用其他的技术,数据科学家需要手动转换特征以通过特定算法获得最佳结果。 这个过程需要时间,也需要大量的猜测。相比之下,深度学习从多层次的输入数 据中学习更高层次的抽象。数据科学家不用猜测如何组合、重新编码或总结输入。

此外,深度学习还可以检测表面上看不见的变量之间的相互作用。它可以检测非线 性相互作用并近似任意函数。虽然可以使用更简单的方法来适应互动效应,但是这 些方法需要手动指定和数据科学家的更多猜测。深度学习会自动学习这些关系。

特征学习和检测复杂关系的能力往往使深度学习成为某些类型数据的不错选择:

高基数结果。对于诸如语音识别和图像识别等问题百度深度学习,学习者必须区分大量离散类别。(例如,语言识别应用程序必须在英语中区分近 20 万个单词。)数学家称此属性为基数。传统的机器学习技术往往在这个任务中失败;深度学习可以解决成千上万的元素的分类问题。

高维数据。在诸如视频分析、粒子物理或基因组分析等问题中,数据集可以具有数十亿个特征。深度学习可以工作于这样大量的“宽”数据集。

未标记数据。标签提供有关数据包的有价值的信息。例如,图像可以携带标签“猫”。对于无监督学习,深度学习可工作于缺少信息标签的数据(例如位映射图像)。

与其他机器学习技术相比,深度学习也有一些缺点。

试看结束,如继续查看请付费↓↓↓↓
打赏0.5元才能查看本内容,立即打赏

来源【首席数据官】,更多内容/合作请关注「辉声辉语」公众号,送10G营销资料!

版权声明:本文内容来源互联网整理,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 jkhui22@126.com举报,一经查实,本站将立刻删除。

相关推荐

评论

  • 昵称 (必填)
  • 邮箱
  • 网址
二维码
评论