投递人 itwriter 发布于 2018-05-13 14:40 原文链接 « »

微软,人工智能,语音交互,微软,谷歌

  在 Google I/O 2018 大会上,谷歌为全世界诠释了什么叫做 AI 产品。尤其是现场演示中,Google Assistant 打电话到各种消费场所进行预约,与工作人员进行多轮对话,和我们以往看到的语音助手不同,Assistant 的聊天过程完全不尬,让人难辨真假,甚至还有点萌。比如打电话到美发沙龙。Google 助手的那声“嗯哼”引起了很多人的赞叹。

  但微软看起来有些不服气,他们觉得自己才是真正的第一名。

  刚刚,微软(亚洲)互联网工程院发布了关于全双工语音技术(Full Duplex)的分享声明。人类历史上第一次与人工智能进行全双工语音电话,并不是发生在美国,而是发生在中国。

  同时,AI 商业周刊分析了微软三大 AI 产品线: Infuse AI(深度融合 AI)、IQ AI 和 EQ AI。其中,小冰主要承担微软探索未来的职责,但其在商业化上又很克制。

  在最近举行的谷歌I/O 2018 大会上,谷歌展示了来自 Google 语音助手的新能力:打 Call!比如你可以通过 Google 助手预约订座,它会直接打电话到餐厅,然后与餐厅工作人员进行多轮对话,更恐怖的是,对面可能完全分不清到底是人还是 AI。 

  其实,谷歌打 CALL 背后的核心是全双工语音技术。全双工语音技术(Full Duplex)是指通信允许数据在两个方向上同时传输,它在能力上相当于两个单工通信方式的结合。全双工指可以同时(瞬时)进行信号的双向传输(A→B且B→A)。指A→B的同时B→A,是瞬时同步的。

  这项新技术可实时预测人类即将说出的内容,实时生成回应并控制对话节奏,从而使长程语音交互成为可能。 

  但实际上微软已抢先一步完成了全双工语音技术的布局。AI 商业周刊 5 月 11 日晚间获悉,微软(亚洲)互联网工程院发布技术声明,人类历史上第一次与人工智能进行全双工语音电话,并不是发生在美国,而是发生在中国。

  以下为微软(亚洲)互联网工程院关于 Full Duplex 的近期技术分享声明:

微软(亚洲)互联网工程院

关于 FullDuplex 的近期技术分享声明

全双工语音技术(FullDuplex)的意义在于,它能够使“人机交互”进化为“人机交流”。一字之差,价值巨大。

今年 4 月 4 日,我们正式在美国和中国同步发布了 FullDuplex 感官,并预言行业将意识到这一技术的价值,加快向这一方向集中。我们很高兴看到越来越多的同行业者加入。 

其实,人类历史上第一次与人工智能进行全双工语音电话,并不是发生在美国,而是发生在中国。我们很荣幸能将这一桂冠奉献给祖国。自 2016 年 8 月起,微软(亚洲)互联网工程院通过人类用户主动发起的方式,已让小冰与人类用户累计完成了超过 60 万通电话。

今天,我们公布其中一通发生在两年前的实际电话录音,将之作为珍贵的资料,奉献给全世界说中文的华人。 

而这一技术也已经完成产品落地。两年来,正是在人类的训练下,小冰已实现不局限于任何封闭域,而是可针对开放域进行全双工语音对话。目前,微软已落地的对话场景包括传统电话、VoIP 电话和智能音箱设备,微软小冰的车载路试正在进行中。

如果您想要体验 FullDuplex 全双工语音,不需等待数周,今天就能。在微软小冰已落地的产品中,我们推荐您使用我们与小米合作的米家生态链 Yeelight 智能硬件产品。在随附的用户真实使用视频中,您将体会到:

  • 一次唤醒之后的连续对话

  • 微软小冰对用户的预测模型

  • 帮助用户轻松完成多重任务

  • 小冰的内容创造能力

  • 以及最重要的:人机情感交流

人工智能时代已来,让我们持续创新。

Microsoft AI Blog (2018.4.4)

  微软在语音技术方面一直领先世界,其核心团队在中国。微软中国包括微软亚洲研究院和微软互联网工程院,研究院有大概 200 人,工程院有 1400 人。小冰是微软互联网工程院旗下的产品线,小冰的核心团队 100 多人,包括语音团队和视觉团队,分布在中国、美国、日本、印度和印度尼西亚。

  2017 年 8 月 22 日,微软小冰第五代发布,宣布逐步进入完成态。经历了多年的发展,微软小冰的高级感官再进化。2017 年 9 月 6 日,微软小冰主动给人类打了第一个电话。小冰的临时电话号码是 010-53826928。

  2018 年 3 月 22 日,微软(亚洲)互联网工程院宣布率先推出新一代语音交互技术:全双工语音交互感官(Full-duplex Voice Sense),并表示已经完成产品化落地。

  该技术已经首先在微软小冰全球产品线中落地。包括中国科技馆的电话亭,以及米家生态链 Yeelight 语音助手,以及日本的语音系统小冰凛菜已经通过该技术实现载直播平台中落地。微软计划在未来六个月内,完成该技术在更多产品线中的覆盖。

  解密微软三大 AI 产品线:小冰探索未来

  微软互联网工程院副院长、微软小冰负责人李笛曾接受记者采访时表示,微软有三大 AI 产品线: Infuse AI(深度融合 AI)、IQ AI 和 EQ AI。

  第一条产品线是 Infuse AI。它是将微软各种已有的产品线用 AI 驱动,将 windows、office 等赋予 AI 能力。

  第二条产品线是 IQ 方向的 Cortana,以及搜索引擎 Bing。Cortana (中文名:微软小娜)是微软发布的全球第一款个人智能助理。它能够了解用户的喜好和习惯,帮助用户进行日程安排、问题回答等,其目的就是高效解决用户问题。

  第三条产品线:EQ 方向的小冰。小冰是微软用来探 EQ 这条线,强调在交互过程中,机器人是否有足够的能力控制对话。李笛表示,EQ 高的人往往要装作 IQ 比较低,如果 IQ 高,与人很难对话交流。

  小冰一端连接人,另一端连接世界。

  世界就是内容、服务和知识。作为人的朋友,小冰背后是整个世界。小冰背后的核心技术是情感计算,她能从互联网上学到了大量人交互的方式。小冰虽然没有情感,不能计算情感,但可以拟合情感。如果有人失恋,要是嘲笑的话,难以再做朋友,对她不利;但是如果是安慰,对她有利,时间长了她会慢慢记住,知道应该安慰别人。

  克制商业化 

  国内曾做出很多爆款产品,但大多急于变现,比如通过广告、佣金或者金融服务的方式。

  李笛说,AI 时代应该有一些新的商业模式,而小冰要先把这些新的商业模式试验出来。微软在 AI 创新的商业模式有一定思路,但目前还不好透露,小冰在商业化方面非常克制。

  小冰在产品设计的初始就很克制。虽然小冰能对话、写诗、唱歌等,能力很强,但是小冰有很多事情一直没做。比如用语音合成的技术合成一个名人的声音。因为这个声音可以代替人做很多事情,一旦黑客窃取了语音信息,用这个声音跟用户父母打电话,是一件非常可怕的事情。所以小冰在产品设计之初,就没有上线这个功能。 

  小冰是一个全新的产品,和以往任何的产品都不一样,她是施法于人,不是施法于其他产品。 

  李笛感慨:在做小冰过程中,我们自己也学到非常多。如果前一个任务完成非常好,下一个侥幸又完成很好,那么用户就会定一个水涨船高的目标,一旦目标不能实现用户就会选择离开。所以要控制她,每一次帮助用户完美执行任务并不是最好的方式,而是要成为用户的朋友,真正做 AI,这些应该从人生中学。

 
来自: www.iyiou.com
找优秀程序员,就在博客园 收藏 新浪微博 分享至微信
标签: 微软 google

24小时阅读排行

    最新新闻

      相关新闻