至少从柏拉图(tú)这样的探究者时(shí)代(dài)开始,什么东西会让人感到好笑,这一问题一直让哲学家(jiā)和科学家感到困惑。希腊人认为,以(yǐ)他人为代价(jià)的(de)优越感是幽默的来源。德国心(xīn)理学家西格蒙德-弗(fú)洛伊德(Sigmund Freud)认(rèn)为(wéi)幽默是一种发(fā)泄压抑能量(liàng)的手段。为了(le)让人们发笑,美(měi)国喜(xǐ)剧演员(yuán)罗宾-威廉姆斯挖掘了他对荒(huāng)诞(dàn)事物的愤怒。
对(duì)于"有什么好(hǎo)笑的?"这个问题的(de)答案,似乎没有(yǒu)人能够达成一致(zhì)。因此,想象一(yī)下试图训练一个机器人笑的场景。但通(tōng)过创建一个从(cóng)共享笑声系统中获取信号的人工智能(néng),日(rì)本京都大学的一个研究小(xiǎo)组(zǔ)正试(shì)图做到这一(yī)点。研究人员在《机(jī)器人(rén)学和人(rén)工智能前沿》杂志上描述了他们为日本(běn)机器人"Erica"创造笑这一表情的新技术。
这并不是(shì)说机器人不(bú)能理解(jiě),甚至不能对一(yī)个糟(zāo)糕(gāo)的笑话发出笑声。相反(fǎn),困(kùn)难(nán)在于为人工智能系统开发人类幽默的(de)微妙之(zhī)处,以增强机器人和人类之(zhī)间的普(pǔ)通(tōng)对话(huà)。
研究人员与(yǔ)Erica之(zhī)间(jiān)的对话(huà)实例。资料来源:Inoue等人
"我们(men)认为对话式人(rén)工智能的重要功(gōng)能之一是(shì)转移情感,"主要(yào)作者井上浩二博士解(jiě)释说,他是京(jīng)都大学信息学(xué)研(yán)究生院智能科学和技术系的助理(lǐ)教授。"当然,对(duì)话(huà)是多模态的,不仅仅是正确的回(huí)应。因此,我们(men)决定,机器人(rén)能够与用(yòng)户产生共鸣(míng)的一种方式(shì)是分(fèn)享他们(men)的笑声,而这(zhè)是基于文(wén)本的聊天机器人无法做到的。"
在(zài)分享笑声的模式中,人(rén)类最(zuì)初会(huì)笑,而人工智能系统则(zé)以笑声作为(wéi)移情(qíng)反(fǎn)应。这种方法需(xū)要设计三(sān)个子系统--一个用(yòng)于检测笑声,第二(èr)个用于决定是否笑,第三个用于选择适当(dāng)的笑声(shēng)类型。
科学家(jiā)们(men)通过注释80多段来(lái)自(zì)速配(pèi)的对话来收集训练数(shù)据,速配是一(yī)种社会场景,大群人在短暂的时间内一对一地(dì)互动。在这种情况下,涉及京都大学学生的"相亲马拉(lā)松"活动让Erica加入其(qí)中,由几个业余女(nǚ)演员远程操作。
"我们(men)在这(zhè)项工作(zuò)中最大的(de)挑战是确定共享(xiǎng)笑声的实(shí)际案例,这并不容易,因为如(rú)你所知,大多数笑声实际上根本没(méi)有共享(xiǎng),"Inoue说(shuō)。"我们必须仔细分类,到底哪些笑声可以(yǐ)用于我们的分析,而不是仅仅假(jiǎ)设任何(hé)笑声都可以被回应。"
笑声的类型也很重要,因为在某些情况下,礼貌的(de)笑声可能比响亮的嗤笑声更合适。实验仅(jǐn)限于(yú)社交性的笑声与欢快的笑声。
研(yán)究小组最终通(tōng)过在一个人和Erica之间用她的新分享式笑声系统创造四(sì)段两到三分钟(zhōng)的(de)简短对话来测(cè)试Erica新学会(huì)的幽(yōu)默感(gǎn)。在第(dì)一个场(chǎng)景中,她只发出了社交性的笑声(shēng),随后在第二(èr)和(hé)第三个(gè)交流中(zhōng)只发出(chū)了(le)欢笑声(shēng),在最后一个(gè)对(duì)话中两种笑(xiào)声(shēng)结合起来。该(gāi)小组还(hái)创(chuàng)建了另外(wài)两组(zǔ)类似的对话作为(wéi)基线模型。在第一组中,Erica从(cóng)未笑过。在第二个中,Erica每次(cì)检测(cè)到人类的笑声时都会发出(chū)社(shè)交性的笑声,而不使(shǐ)用其他两个(gè)子(zǐ)系统来过(guò)滤背景和反(fǎn)应。
研(yán)究人员共召集了(le)130多(duō)人(rén)听取了三种不同条件(jiàn)下的每(měi)个场景--共享(xiǎng)笑声系统、无笑声、所有笑声(shēng)--并根(gēn)据移情、自然、人类相似性和(hé)理解来评估(gū)互动(dòng)。共享笑声系统的表现优(yōu)于任何一种基线。
"这篇论(lùn)文最重要的(de)结果是,我们已经展(zhǎn)示了我们如何将所(suǒ)有这(zhè)三项任务结(jié)合到一个机器人中(zhōng)。我(wǒ)们相信,这种类型的(de)组合(hé)系统对于(yú)正确的笑的行为是(shì)必要的,而不仅仅(jǐn)是检(jiǎn)测(cè)到笑(xiào)并对(duì)其做出反(fǎn)应,"Inoue说。
在Erica准备好参(cān)加脱口秀表演之前,还(hái)有很多其(qí)他的笑声方式需要建模和训(xùn)练。"还有许多其他的笑的功能和类型(xíng)需要考虑,这不是一项容易的任务(wù)。我们甚至还没有尝试对不共享的笑声进(jìn)行建(jiàn)模,尽管它们(men)是最常(cháng)见的,"Inoue指(zhǐ)出。
当然,笑声只是(shì)与机器人(rén)进行类似(sì)人类(lèi)自然对话的一个方面。
"机器(qì)人实际上应该有一个独特(tè)的性格,我们认(rèn)为他(tā)们可以通过他(tā)们(men)的对话行(háng)为来显示这(zhè)一点,例如笑(xiào)、眼睛注视(shì)、手势和说话风格,"Inoue补(bǔ)充说。"我们认为(wéi)这根本不是一个简单的问题,很可能需要10到20年以上的时间(jiān),我们(men)才能最终与机器人(rén)像与(yǔ)朋友一(yī)样进行休(xiū)闲聊天(tiān)。"