作者:hedy
 
  陶行知说“人力胜天工,只在每事问”,论语说“敏而好学,不耻下问”。在古代就倡导通过发问来解决困惑。现在虽然大家解决疑问的方式有很多种,但是“问”还是最自然朴素的一个行为。所以互联网兴起了很多问答产品, Quora、Aardvark、知道、问问、知乎等,每天数以百万计的用户通过这些问答平台答疑解惑。

  随着移动终端的普及,越来越多的网友习惯随时随地的能够通过问答获得帮助,催生了现在很火的智能机器人。有些已经在微信上建立公共账号,通过微信来和网友进行互动,比如小i机器人、搜狗语音助手、讯飞语音等。另外还有一些企业账号,比如招商银行信用卡中心、平安人寿等公共账号,可以提供账户信息查询甚至业务办理等简单的客户服务。
 
  微信自身也有一个客服账号“微信团队”:在大家安装微信后 ,“微信团队”在第一时间会告诉大家有微信相关的问题可以问它。目前该账号每天会收到几十万的用户反馈,已经成为了微信平台上反馈量最大的客服账号。为了及时解答用户使用微信过程中碰到的各种问题,让用户体验更顺畅,问问和微信团队合作启动了微信自动客服机器人项目。经过不到半年时间的探索和积累,目前该客服机器人服务已经在微信全平台流量上线,与之前人工+简单规则的方式相比,自动客服回答的覆盖率提升将近一倍达到50%,准确度则达到85%左右。
 
 
  大家看到这里可能就要犯嘀咕了,不就是一问一答这么简单吗?有什么亮点呢? 其实,这也正是微信客服机器人的本质所在:使用形式上追求的就是简单易用、无需用户思考,而背后的技术积累和尝试却有不少值得与大家分享的话题。接下来我们就来聊聊微信客服机器人项目里,看似简单的一问一答所承载的那些不简单的事儿。
 

 

自然、简单地问:


  用户怎样提问最自然最简单呢?当然是平时怎么说话就怎么问喽。用专业的术语说,就是使用自然语言,此外直接用说的就更方便了。“微信团队”公众号有一半以上的反馈都是语音反馈,我们也会在近期上线用户语音反馈的识别及自动回复。

快速、准确地答:

  在古代,如果被问的人不知道答案,提问人得不到答案岂不是很焦虑?难道要像武侠小说中闭关修炼耗费数十载来自己悟出真谛?!现在,我们可以汇集问问等腾讯平台上所有热心用户的智慧,秒杀你的问题。如果之前有人和你问过一样的问题,我们可以直找到他的满意答案并发给你。如果之前没人问过怎么办呢?别着急,亿万热心的在线网友会迅速帮你解决。
 
  快速 = 自动;  准确 = 精准理解用户意图 + 正确的答案
 
  这样我们的客服机器人模型就出来了,以下我们重点介绍自然语言理解的机器人思维方式和自我学习方法。

 

  机器人的思维方式: 像人类的左右大脑一样,客服机器人也有两种组织知识的思维方式:
 
一、组合思维(机器人的左脑,抽象思维):


     机器人可以从最小语义区中的词汇组合成简单句,因为汉语的非结构性特点,所以简单句中不考虑词汇的语序。而多个简单句的无序组合进而生成包含更多语义的复杂句。而这一过程就是机器人思维正向生成过程。整个过程突出了无序组合的特点。
在组合方式下:知识通过由外向内的方式生成,即由复杂句分解为简单句,简单句再分解为最小语义词汇。而识别过程则是由内向外,从输入的句子中提取核心词汇,然后生成知识库中最可能的简单句或复杂句来匹配对应的用户反馈。

 

二、有序思维(机器人的右脑,形象思维):

    有序思维不像组合思维那样无序地且从最小语义词生成有意义的句子,而是从一开始就以句子的方式去组织知识。句子中的词汇是有序构成的。图中的蜗牛型曲线上排列着所有的句子,而且具有相同前缀的句群表示为束状发散的枝干;所有句群按照起首汉字排列在蜗牛型曲线上。

 

  图中的典型束状句群片段如下所示(句群也可以只包含一句话):

  一个句群是将按照句中词汇组成一颗句树,其中的节点代表一个词,也可以代表一个wildcard,即任意几个词,这样机器人就可以识别简单的模式。

  在有序方式下,句群按照句首字母序排列在蜗牛线上。识别时,机器人沿着蜗牛线寻找句群,找到句群后再进一步检索到最佳匹配的句子。


  同时,无论是基于有序思维还是组合思维的知识组织方式,我们都为具有最小语义的词汇建立了同义词表。同义词表极大地加强了两种思维方式对输入句子的处理能力。
 
l  机器人的自我学习方法:
 
  每当碰到一条机器人大脑理解不了的用户反馈,就需要通过自动模式识别和人工内容运营的配合来完成新知识的学习:首先,机器人通过高频模版挖掘技术,自动发现用户最常问的、但是目前还没有有效回复的内容;然后,通过中心意思提取模块,自动提取出用户反馈的核心内容;知识运营人员基于提取出来的核心内容,进行知识的扩充,并最终添加进入机器人的大脑知识库。


  中心意思提取模块,首先提取出用户反馈的问题句子的树状结构,然后再细致分析每个结点所对应的中心意思;最终,根结点的中心意思就是整个句子的中心意思。
这部分的自动学习逻辑如下图所示:

 

  上面分享的机器人思维方式和自我学习方法两个核心技术,我们做了不少尝试,也在微信客服机器人项目中取得了良好的效果。但是,如何能够更好地模仿人对新知识的发现、学习、和组织的机制,是一个需要我们不断努力探索和实践的课题。另外,客服机器人涉及到的内容分类、知识管理等其他技术,也是我们接下来要继续完善并优化的。

智能客服机器人的发展展望


 智能客服机器人有很多的应用场景,大到500强企业的客服,小到淘宝、拍拍等平台上的个体卖家,都迫切需要高效、精准的客户服务。


  未来,我们希望结合问问平台上积累的数以千万计的热心问友、好几亿已有满意答案的问题,把智能客服机器人打造成以上述技术为核心的,能够为客户提供智能的客服服务、营销服务、以及用户互动监控的完善的服务系统,成为微信平台上的公共帐号提供“标配”的客服问答服务,并推广到其它的产品和平台。

 

  狄更斯说,“世界上能为别人减轻负担的都不是庸庸碌碌之徒。”是的,智能客服机器人项目的愿景就是能快速地帮助大家解决各种疑问,提高大家的工作和生活的效率和质量。