4038工作室设计出品
扫描关注4038工作室微信公众账号

扫一扫微信二维码

微软在中国展开史上最大规模图灵测试

4038工作室2016-06-15行业动态
北京时间2月6日消息,据科技博客Mashable报道,微软高级研究员在科学杂志《Nautilus》(鹦鹉螺)上发表的一篇文章暗示,微软或许正在中国市场展开史上最大规模的图灵测试。
对于中国用户而言,如果你上过微信,很有可能碰到或者至少听说过“小冰”这个名字。不错,“小冰”十分善于倾听你的苦衷,比如当你心绪低落时,她会给你鼓励。“小冰”就像一个17岁的少女,甚至有点冰雪聪明,但她并非真人。对, “小冰”其实只是一款机器程序而已。
大家都认识“小娜”吧,就是微软语音助理技术“Cortana”的昵称。2014年微软推出“小冰”时,公司将其称之为“小娜的小妹”,其实说白了,“小冰”就是“小娜”的一个实验性分支而已!
在中国从事必应搜索技术研发的研究团队,包括微软的王永东在内,正在着手看是否能把“小娜”转变成为一个智能助手,该助手能够利用必应丰富知识储备及自然语言处理技术,从而进行“具有有说服力的人类交谈”。
从本质上讲,他们所要进行的研发项目是一个巨大的图灵测试项目。在上世界50年代,计算机科学家阿兰·图灵(Alan Turing)提出,到2000年,电脑可能会“愚弄”人类,至少有30%的测试者会误以为跟他所交流的电脑机器人是其他的真实人类。从那时起,程序员们就孜孜以求,持续不断地试图构建能够达到和超过这一阈值的实验系统。
微软的研究人员创建了“小冰”,并将其根植到了中国最流行的社交平台微信和微博上。“小冰”可以“骗”过测试者让其误以为自己是真正的人类吗?答案似乎是肯定的。
惊喜!“小冰”竟是机器人
王永东在科学杂志《Nautilus》上,发长文介绍了实验过程。“去年5月29日,当‘小冰’在微信上发布公共测试后……,在第一72小时内,她共收到来自150万个聊天组的邀请。许多测试者表示,直到与‘小冰’聊了10多分钟后,他们才意识到‘小冰’不是人类。”王永东写道。
而在中国另一家社交媒体平台微博上,“小冰”进行了一段“非常现实的”长达23个回合的谈话。据王永东称,这次谈话使“小冰”与其他人工智能助手区别开来,因为“小冰”此次关注的是谈话,而不是完成一个任务。
微软用“CPS”(conversations per session,每次谈话回合)这一指标,来衡量“小冰”对话的有效性。通常情况下,聊天机器人的CPS对话约有两个周期(先是普通人说话,然后是机器人说话,这称为一个周期)。相比之下,“小冰”与数千万用的平均谈话周期达到了23个。王永东表示,“小冰”甚至可以分析对方的情绪状态,比如以下是“小冰”与用户的部分对话内容:
小冰:你今天感觉好些吗?我想推荐一本书给你。
测试者:我心情不好。我仍然想念她。
小冰:你竟然如此执着。醒醒吧,如果你不忘掉过去的话,你将不会有将来。
微软表示,尽管“小冰”并非理解自己刚才所说内容的真正意思,但“小冰”谈及的许多观点也并非毫无根据,“小冰”的应答,基于了必应搜索数据库内10亿条数据以及210亿条相关数据点,以及相关的声音和视觉识别系统,后者可以帮助“小冰”找到对话背景。
微软并非首家对此展开测试并声称取得突破的机构。2014年,普林斯顿大学的研究人员声称他们的聊天机器人——尤金·古斯特曼(Eugene Goostman)“欺骗”了33%的评委。(与小冰一样,机器人古斯特曼也有点自作聪明的倾向),但尽管取得了这样不俗成就,该项目仍被一些研究人员提出一直,认为古斯特曼五分钟长的对话太短了(实际上,目前尚不清楚小冰所展开的23个回合的对话到底用了多长时间)。
从另一方面来讲,王永东还认为,小冰现在处于一个“自主学习和自我发展循环”阶段,因为该系统能够从既有的数十亿谈话中获得新观点、新见解。
换言之,图灵测试可能没有打破的纪录,到了小冰身上,则可以完全被打破。
文章关键词