猜物游戏有助于机器理解人类

猜物遊戲有助於機器理解人類

机器听懂使用者的需求,再给予合理的答覆,这听起来早已是Siri、Alxea这类语音助理能轻鬆做到的事情。只要结合前端的语音处理、后端的机器学习架构(像是Seq2Seq),似乎只要给极大量的资料,让模型持续接受训练,机器便有望能越来越像人一样进行正常沟通。

但很多时候,情况并不是这幺地理想。如同片面之词对人而言可能有不同解读,对机器来说也是一样的道理。要如何能帮助机器理解人类的语意,便成了一些资料科学家着眼之处,这里要介绍的与神经网路架构无关,而是站在讯息模型的角度,尝试找出有效沟通的方法。

为何有效沟通如此重要

最近由美国陆军研究实验室(U.S. Army Research Laboratory, ARL)与密西根大学(University of Michigan, UM)合作的研究已发展出新的技术,不仅助于降低机器理解错误的机率,还有望能使人工智慧适应各种複杂的场合。

「人工智慧的应用早已充斥于日常生活中,像是手机,它们特别适合回答特定类型的问题。」ARL的Sadler博士说:「但情况若是在紧张的军事环境中,就非常不同了。问题往往只有几个目的,同时也没有充足的时间让人进行完整对话,因此我们希望机器要能在和人们的一系列问答,还有只字片语中快速釐清重点。」

是非题游戏

让机器听懂人们的重点?或许可以不用想得这幺複杂。

有个想法启发自1950年代,在美国蔚为流行的娱乐节目「Twenty Question Game」。在这个猜物游戏里,挑战者最多只能向主持人提出二十个问题,若能在时限内猜出答案便能获得奖金。有趣的是,在游戏过程中规定挑战者只能提出是非题,像是「它比麵包盒还大吗?」、「它是活着的吗?」这样,更增添了不少难度。

研究团队将游戏的想法推展至人类与机器的沟通:机器试图找出人类想法中的核心,然后人类针对机器的提问做回应。在这样的一来一往之间,希望达到机器想推测人类想法的终极目标。或许模仿「Twenty Question」的模式,会是个最有效率的方法。

「人们特别善于回答是或否的问题。」Sadler还说,机器必须能在越少的问题中快速釐清主旨,并强化每一对问答隐藏的价值。「总不能让处在危险之中的士兵还要拼命解释情况吧?」

建立资讯传递模型

在论文中,团队将焦点放在资讯传递(Information transaction)的理论上。为仿造人机沟通的情况,他们建立了一个模型,其中存在着两个重要角色:Oracle,答案X的持有者,负责接收来自Player的问题Q,给出一个回应Z。另一位称作Player,则是负责根据Oracle的回应Z,猜出答案X’,并在下一次的迴圈中向Oracle提出问题。

猜物游戏有助于机器理解人类

图一、资讯传递模型,(译者自绘,参考自[1])

当然这模型并非真的如此简单,有两项重要的设计左右着资讯传递的成败。

就像是人在紧张的时刻,容易提供错误的资讯。也许Oracle始终明白答案是X,但却不小心给出了可能不是那幺正确的描述Y。所以由Oracle输出的资讯会通过一道带有杂讯的Channel(在图一中,以条件机率表示),再送到Player的手上。

另一方面则在于,提问的顺序使否需要根据Oracle的回应做适应性(Adaptive)的调整。这就好比在「Twenty Question」中,由于提问次数有限,玩家得要就现有资讯,提出最有价值的问题。在论文的模型里,便以回授(Feedback)的方式将Y传递给Controller,并由它决定在下个迴圈该提出哪个问题。

说了这幺多,整个模型其实可以简述成一个通讯系统,在有杂讯干扰的情形下,试图让Player推估的答案X’与Oracle持有的答案X越接近越好。这里就使用了常见的通道编码(Channel coding)策略[注一],Unequal error protection(UEP)[注二]以及衍伸的编码方法Superposition coding。

有望产生更有效的对话方式

详细的数学推导过程在此不多说,但就结果而言,团队是想出了特别的编码策略,能够使X与X’的方均差,以更快的速度收敛(定义迴圈数为N,则原始方法的速度为指数项根号N,新方法则可达到指数项N)。换句话说,在这样的架构下使得每次的问答都更具有意义,帮助Player(机器)能更快地了解Oracle(人类)的持有资讯。

ARL表示,这样的研究方法还在持续着,除了游戏的想法以外,还在探索更有效率的架构,希望能在不远的未来促成人工智慧与士兵的合作模式。

*注一:在通讯系统中为了避免讯息遭到杂讯干扰,造成讯息的失真,会藉由特殊的编码方式,帮助收发端辨认讯息的真伪,有兴趣可参见[3]

*注二:一种在重要资讯(Most significant bits)上做较多保护,若不重要则保护较少的编码策略。

编译来源:U.S. Army Research Laboratory. “Scientists help robots understand humans with 20 questions game idea.” ScienceDaily. ScienceDaily, 7 March 2018.


参考文献

[1] Hye Won Chung, Brian M. Sadler, Lizhong Zheng, Alfred O. Hero. Unequal Error Protection Querying Policies for the Noisy 20 Questions Problem. IEEE Transactions on Information Theory, 2018; 64 (2): 1105 DOI: 10.1109/TIT.2017.2760634[2] ARL Public Affairs. Army scientists help robots understand humans. Feb. 2018.[3] 叶丙成,「为何传简讯、email 很少出错? 漫谈通讯与通道编码技术」特色图片来源:Shutterstock

相关推荐