通过机器学习，打造萌萌的角色人工智能_技术分析

这篇文章将要讨论一种角色人工智能(character AI)的新形式。它与脚本动画当中的动作捕获非常相似，这种新技术也许可以通过观察真实的人类产生的行为从而革新交互性角色被创建的方式。\r\n\r\n我将通过一个产品来说明我们在此技术上的领先地位。\r\n\r\nbots_alive —— 一个边玩边找出路的机器人\r\n\r\n我们今天在 Kickstarter (这里的活动)上推出了 bots_alive。这里是一分钟的预告视频，主要是脚本运动。\r\n\r\n该产品(the Hexbug® Spider)是一个智能手机套件，可以使一个流行的遥控玩具(RC toy)拥有简单却逼真的自主权。\r\n\r\n该视频展示了我们最初的产品设计理念。在新的角色人工智能技术驱动其核心功能之后，现在你可以看到它是如何运作的。\r\n\r\n观察全速播放视频，从而理解高级行为。使用 YouTube 的控制功能降低速度，以查看更多低级别的行为，比如好奇和不确定的时刻。\r\n\r\n训练数据以建立角色\r\n\r\n以一种新方式为那些机器人构建角色人工智能(character AI)。下面是其工作原理。\r\n\r\n人类在许多不同的场景中远程操控机器人。远程操控者就像是即兴的傀儡师;他(她)遵循着启发式方法，也理解机器人并真实地回应所发生的，无论是好奇，恐惧，欢庆或是另一种情绪。\r\n\r\n对于 bots_alive，操控者通过屏幕看到系统所看到的镜像并按下按钮以发送前进、后退、左、右、前右、前左、后右或者后左的指令。我们同样认为不按按钮意味着无动作的指令。\r\n\r\n从那些远程操作会话中，我们收集训练数据，其中包含 (a)远程操作指令和 (b)所给出的每一个指令的上下文信息。应用被称为监督学习的一类机器学习来创建操纵者的模型，问题得到了有效解答。\r\n\r\n在上下文 X 中，远程操控者给出命令 Y 的概率是多少?\r\n\r\n构建一个行为模型\r\n\r\n所有这些都发生在开发过程中。在最终用户手中，机器人由模型自主控制。而模型的操控者则是角色人工智能(character AI)。\r\n\r\n

图灵计算机科学丛书_图灵程序设计丛书 pdf_图灵程序设计丛书:机器学习实战

\r\n\r\n我们假设，在训练数据中的上下文信息足够证明为什么远程操控者选择一个动作而非另一个。然后图灵程序设计丛书:机器学习实战，数据包含着自发性、不确定性以及由人类操控者所展示出的社会真实性。如果机器学习有效，则自动机器人将保有这些品质。\r\n\r\n为什么选择使用带来麻烦的机器学习?\r\n\r\n我们期待这个过程可以创造出比传统角色人工智能(character AI)更加自然和鲜活的角色人工智能(character AI)。\r\n\r\n传统的方法包含了想象和书写行为规则或者有限状态机。比起作为操纵者沉浸在某一个情况中，这更像是一个抽象的练习。\r\n\r\n如果你玩视频游戏，想象一下你有时会对你控制的角色产生共鸣。你甚至会忘记你们之间的距离，作为那个角色来体验世界。如果你为这个角色简单书写了一套规则使其依靠规则行动，比起这个角色将会做的，你的控制在这些时刻是不同的，这个不同介于高水平和微小运动之间。\r\n\r\n差异中蕴含着这种开发角色人工智能的方法的前景\r\n\r\n在心理学的研究方法中，有一个广泛的共识，如果你想要知道一个人在某种情况下将要做什么，你不要询问他们会做什么。将他们置于这种情况下并进行观察。

传统的角色人工智能(character AI)开发就像是在询问人类开发员或者设计师。与之相反，我们的方法类似于对沉浸在角色体验中的人进行观察。这就是为什么我们期待它创造更加真实的角色。\r\n\r\n我们的方法是一种被称为从示范中学习的应用。很多时候，远程操控需要包含人类与角色的互动，我们则对远程操控保密，这样人就不会因为和一个机器角色互动而对自己的行为有所改变。在 MIT 的多媒体实验室，当它还是一个研究项目时，我们创建了这个保密的版本 (learning from the wizard 或者 LfW)。这个名字结合了从示范中学习和 Wizard of Oz 实验范式。\r\n\r\n我的第一份工作是通过人类远程操控和机器学习来创建角色人工智能(character AI)图灵程序设计丛书:机器学习实战，与 Sam Spaulding 和 Cynthia Breazeal在 MIT 的多媒体实验室完成。\r\n\r\n作为交互式机器学习训练\r\n\r\n在我们的开发中，我是远程操控者以及机器学习程序员。\r\n\r\n训练过程不仅仅是一连串的证明。不如说，它是一个关于证明的迭代过程。\r\n\r\n将机器学习应用在示范数据集上，\r\n\r\n从已知模型中观察行为\r\n\r\n在机器人不能令人满意地行动的情况下，创建更多的范例。\r\n\r\n应用机器学习等等\r\n\r\n

图灵程序设计丛书:机器学习实战_图灵程序设计丛书 pdf_图灵计算机科学丛书

\r\n\r\n交互式机器学习的通用表示。来自 Amershi 等人，2015。 Power to the People: The Role of Humans in Interactive Machine Learning。在 AI Magazine。\r\n\r\n在这些迭代中，远程操控者和算法设计者还会反映出上下文信息中什么地方需要被编码以提升其学习能力，确定上下文不能被编码并且因此应该被远程操控者忽略，比起原始的操控者，这样可以发现乐趣和更令人愉快的行为。\r\n\r\n我们如何知道这是更好的呢?\r\n\r\n我们不能。不能 100% 保证\r\n\r\n但是我们已经看到它可以作出令人信服的角色人工智能(character AI)。\r\n\r\n我们在 MIT 的研究中已经看到了它。在一个相对较大的随机试验中，孩子们与人类远程操作的机器人或者一个从先前的远程操作中学习自主行为的机器人互动。与无机器人的情况相比，远程操控机器人和通过机器学习编程的自主机器人从它们的人类交互伙伴中引出了类似的行为。奇怪的是，当询问孩子们这些机器人是远程遥控的还是自主的时候，在每个条件下都会有大约一半的人认为这是人类操控的。

图灵程序设计丛书:机器学习实战_图灵计算机科学丛书_图灵程序设计丛书 pdf

如果你熟悉图灵测试(Turing Test)，一种广为人知的检测人工智能有效性的测试，你可能会意识到，MIT 的研究构成通过了一个狭隘和社会性的图灵测试(Turing Test)。\r\n\r\n在 2004 年的虚拟联赛(Unreal Tournament)，引人注目的角色人工智能(character AI)，使用了类似

试看结束，如继续查看请付费↓↓↓↓

打赏0.5元才能查看本内容，立即打赏

来源【首席数据官】，更多内容/合作请关注「辉声辉语」公众号，送10G营销资料！