更多精彩 >

语音助手鏖战“全双工?#20445;?#36710;载会是一个好场景吗?

2019-10-22 13:44:40   来源:投资家网专栏  作者:科技响铃说 

摘要:一方面,作为最接近自然交互的形式,全双工已经成为智能语音领域的“香饽饽?#20445;?#21508;大AI语音巨头都在积极布局。

文|曾响铃

来源|科技向令说

一方面,作为最接近自然交互的形式,全双工已经成为智能语音领域的“香饽饽?#20445;?#21508;大AI语音巨头都在积极布局。

另一方面,车载场景的人机交互需求也越来越强烈,在手没有被完全解放的情况下,驾驶员们对更自由、更随性、更解放的语音交互有着更强烈的需求,全双工为应用“刚需”。

与普通生活场景不同,车载环?#36710;撓没?#25163;动操作更加不便捷,而同时又往往有诸多功能操作(例如关窗、开空调)、生活服务(例如导航)、娱乐消遣需求(例如听歌),多样化需求更需要更连续的对话体验——如果每一个指令?#23478;?#21796;醒口令,不但?#27809;?#20307;验不佳,从旁观者看,这种交互方式也颇?#34892;?#23604;尬。

与此同时,有限空间里的司乘对话,多人对话与人机交互叠加,加上驾驶环?#36710;泥性櫻?#26080;疑对智能语音提出了更严峻的挑战。

于是,迫切的?#27809;?#38656;求加上庞大的商业价值空间,以及车企这些年对产品创新的?#26159;螅?#22312;这场全双工的鏖战中,车载语音场景不出预料成了玩家竞逐的焦点,全双工+车载的“搭配”迎来广阔的市场机会。例如,不?#20204;?#30340;重庆智博会上,腾讯云小微就联合腾讯车联展示全双工语音交互技术,让?#27809;?#23545;车载语音助手有了更多的好感和期待。

巨头鏖战全双工,也推动“第三空间?#26412;?#36880;走向台前

目前为止,车载+全双工落地应用?#28304;?#20110;初期阶段,技术研发与应用适配同步进行中。

1、车载全双工,巨头各有玩法姿势

微软在2018年3月底宣布“全双工语音交互感官”已完成产品化落地,“长程语音交互成为可能?#20445;?#21040;2019年8月,又宣布全双工语言交互技术已经通过车载设备完成测试,已经有了几个测试合作汽车厂。

微软的全双工语音及其车载应用是小冰项目的?#26377;?/span>,第七代微软小冰的重心之一是实现车载商用,逐?#25509;傘?#29609;具”转向现?#23548;?#20540;,车载无疑是当下最恰当的选择。

而百度在押宝AI战略的大方向下,全双工技术的推广十分积极。今年7月,小度助手升级的全双工语音已经在小度在家智能音箱产品上使用,且开放赋能给更多智能?#24067;?#32456;端。

入局语音交互领域较早的科大讯飞,在2019年5月底发布了智能物联网操作系统iFLYOS 2.0,也在多个领域开始了全双工交互技术的应用尝试。

今年8月,重庆智博会上,腾讯云小微全双工语音技术也正式对外展示。依靠腾讯云小微这些年在语音技术上的深耕,选择了最为“刚需”的车载场景率先落地全双工交互技术,试图从最符合?#27809;?#38656;求的驾驶场景打头阵,然后进行全域拓展。

车联网与AI助手的结合,也是技术与生态基础上的B+C的搭配,非常符合腾讯在ToB转向过程中的一贯调性。

2、技术推动下,第三空间正由概念走向?#23548;?/span>

在很久之前,汽车就被认为是家庭、工作之外的“第三空间?#20445;?#22312;?#35775;?#31561;汽车文化浓郁的国家,车的第三空间价值十分明显。

但在中国,日常出行的属性仍然占据大头,?#27809;?#36827;入车内,听音乐、导?#20581;?#35843;空调……在不用重复唤醒的情况下,很自然完成一套操作……把全双工放到车载场景中,如果从汽车角度看,?#23616;?#19978;是“第三空间”的一?#26234;?#21270;。

抛开技术,从具体场景?#23548;?#26469;看,巨头们在全双工领域的布局和竞争,也在推动“第三空间?#26412;?#36880;走向台前,谁能让?#27809;?#30495;正体会到车上服务的便利,挖掘这个空间的?#27809;?#20215;值,谁就能在车载场景中实现商业突围,这本身也与汽车厂商求新、求变、谋求市场增量的需求相吻合。

第三空间的体验塑造,将面对?#27809;?#30171;点的“三重区分”的挑战

离开汽车视角,从全双工技术视角来看,其面临的首要挑战在于,如何在连续对话中还能拥有很高准确率和响应速度。

例如,从已有资料看,腾讯云小微的全双工语音交互技术,在30秒到90秒的时间?#27573;?#20869;(?#27809;?#33258;行设定),一次唤醒即可实现连续对话,过程中?#27809;?#21487;以随时打断机器的回答。

而除了全双工的特殊能力,腾讯云小微可实现车载复杂噪声环境下唤醒率97%以上,语音识别准确率96%以上,意图理解准确率高达98%。

这里不去?#21592;?#36825;些数字的优劣,毕竟多数语音助手都能拿出还不错的成绩,但它们至少说明 “全双工”交互下,准确率仍能保?#25351;?#27700;准。不过,在汽车有限的第三空间里塑造?#27809;?#20307;验,语音助手们还有三大硬骨头要?#23567;?#23454;现?#27809;?#30340;三种“区分”需求。

1、在几何?#37117;?#26415;?#35759;?#21319;级的基础上,区分“情?#22330;?/span>

腾讯云小微称包括播放音乐、导?#20581;?#26597;股票、查天气等众多服务在内,?#27809;?#37117;可以通过语音指令,跟车机一次唤醒、连续应答、自然交互,这其中涉及一个很重要的问题:跨情?#36710;?#20840;双工服务。

目前的车载语音助手已经可以做到在一定场景内免唤醒,例如常用的听音乐,想听A歌曲又反悔,想听B歌曲,机器自动识别不需要?#27809;?#22810;次唤醒。

而当场景需求延展后,全双工语音技术就不得不面临既要连续、又要跨情?#22330;?#24605;考”的挑战,而这又几乎是汽车体验的必须,内容、导?#20581;?#26597;询、设备控制……区分场景是“全双工”的必要技能。

很明显,即便是人的沟通在转换话题时也需要适应,机器在面临这?#26234;?#22659;跨越的全双工语音时,其?#35759;?#26159;乘法级的几何提升,而非仅仅做叠加而已。

2、在复杂的对话环境中,区分“人”

与?#35775;?#19981;同,在当下中国汽车文化中,家庭单位属于仍然强于个人单位,“每家都有车”而不是“每人都有车”。很多时候,车中不只有司机,而肯定有副驾驶等其他乘客。

所?#20581;?#31532;三空间”不只是为司机服务,也为所有乘?#22836;?#21153;。

对车载全双工而言,这又带来一个特殊的问题,如何让不同的人有属于自己的完整体验。如果把全双工比作一个人,与之沟通时,司机或乘客肯定都希望他与自己的沟通是完整的。

从当前的解决方式来看,行业主要采用多音区设置:主驾唤醒之后,都是听主驾的声音,副驾的唤醒后,都是听副驾的语音,理论上,另一个人要接入全双工交互,必须重新唤醒,才可以开启自己的完整对话体验。严格来说,这是通过物理设置的替代性方案,并非机器对不同声音的完全识别,而是通过声音的来源区分“人”。行?#30340;?#20063;正在发展的“声纹识别技术?#20445;?#30452;接辨别不同的?#27809;В?#25110;才是未来更为彻底的解决方案,不过这仍需要等待。

3、在丰富多样的服务中,区分“需求”

智能语音从一开始就是?#25945;?#33151;走路:前端听懂?#27809;?#35828;了什么,后端根据?#27809;?#30340;个性化需求推荐给不同的内容、服务,或者执行某些操控指令。

放到车载全双工这里,其实问题拓展到了两个层面:

怎么听懂是对机器说的,而不是对其他人说的(?#28909;?#20154;和人聊天),不要误解?#27809;?#30340;需求;

在确定是对机器的需求后,如何实现更为个性化的服务输出,毕竟,如果?#27809;?#24819;吃点?#19981;?#21507;的,你随便导航到了一个?#27809;?#19981;?#19981;?#30340;店子,或者甚?#21155;没?#24819;要去放松一下,你给导航到了公司,这样的连续交互也就失去了意义。

前者需要语音识别能力的极大加强,它还?#34892;?#22810;细节需要用技术实现,例如腾讯云小微称其借助云端大脑,不但能理解?#27809;?#30340;话哪些是需要响应的指令,哪些只是?#27809;Ф员?#20154;说的话,这其中同样涉及复杂场景需求问题,懂更多还要区分是不是需求,挑战进一步升级。

后者,?#23616;?#19978;可以视为个性化推荐机制的?#26377;?#32771;验的语音助手背后的?#25945;?#25968;据能力,如何在尽可能短的时间内了解眼前的?#27809;В?#20026;其提供定制化服务,强化全双工的“实质”支撑,而不是只有花架子。腾讯云小微打出“懂你所需”的旗号,通过训练后推?#25237;?#21046;化服务内容,这是全双工技术的行业必然,只是看谁能更为准确。

对?#27809;?#32780;言,同样是自然的交互,如同与人交流一样,与一个“懂你所需”的全双工语音助手交互,就像是熟人聊天,而与无法实现定制化服务输出的机器交互,就像是在和陌生人聊天,其体验差距无需多言。

全双工语音助手趋势不可避免,车载只是拼图的一块

几乎不会有人否认,语音助手是人机交互必然趋势。经过几年的发展,在巨头们的努力下,越来越高的语音识别准确率,各?#25945;?#39130;出的准确?#25163;副輳?#26412;身就证明机器的“听见”和“听懂”已经逐步实现,剩下的是不断完善的过程。

而“智商”问题一旦接近解决,“情商”问题就走向台前,让机器更贴近人,实现人性化、情感化,是语音助手必然的趋势。

于是,全双工等新技术不断涌现。几乎可以肯定的是,在未来,一方面全双工必然要突破参数瓶?#20445;?#20363;如没有30秒、90秒的区分,而是?#23604;?#36830;续同时准确识别需求,就是如科幻片机器人管家那样的无缝交互,这是语音助手发展的必然;另一方面,更多其他的科技将不断涌现,例如多模态识别,将声音、图像、环?#36710;?#35832;多因素整合来与?#27809;?#33258;然交互。

而显然,虽然车载急迫需要全双工等更多自然交互技术,但全双工并不只会局限于车载。几乎所有巨头的全双工技术的“理想”都是全场景应用,即便是腾讯云小微选择以车载为典型,未来也必将在全领域发力——到目前为止,在出行领域之外,腾讯云小微凭借全栈AI能力及腾讯丰富的内容?#22836;?#21153;生态,在文旅、政务、教育、智能?#24067;?#31561;多个领域都有涉猎。

?#26434;布?#20026;例,腾讯云小微AI应用解决方案已经输送?#20132;?#22120;人、智能电视、智能音箱、智能空调等多个?#25918;?#22810;款产?#20998;校?#32780;且百度、科大讯飞、阿里等玩家都在积极布局。

可以说,车载是全双工最热的局部战场,未来的全双工将是全领域的战争,届时,当物联网真正全面落地时,汽车这样的第三空间将融入一个相互连接、不分彼此的“唯一空间?#20445;?#36710;载全双工与家居、工作全双工联动,人与虚拟数?#36136;?#30028;将实现无缝对接。

拭目?#28304;?#21543;。


原创

互联网保险从“1”?#20581;??#20445;?#24320;心保为更多家庭提供完善保障

开心保

近年来,随着国内互联网经济的迅速发展,互联网保险的增量也是?#29615;?#29467;进。

2019-09-11

原创

杭州“人才生态37条”打造人才高峰,58同城全维度服务构建招聘生态

58同城

近日,杭州市出台“人才生态37条?#20445;?#23601;高峰人才引育、体制机制?#27597;鎩?#20840;球人才招引、人才西进等方面,提出...

2019-09-11

汽车后市场前景广阔,抖8车机引更多经销商加入

四维智联

当前,汽车保有量持续增长,国家部门数据显示国内的机动车、驾驶人总量及增量已居世界第一。

2019-09-11

原创

全国五城,中信银行联?#19979;?#24403;劳推出线下主题店

麦当劳中信银行

近日,中信银行携手麦当劳在?#26412;?#19978;海、广州、深圳、杭州五座城市,以跨界合作的方式正式推出了“中信银行...

2019-09-11

原创

投资家网快讯|百观科技获数百万美元战略融资,标普、华创参投

百观科技

百观科技是一个服务专业投资机构及新经济企业的数据分析产品?#25945;ǎ?#22522;于最新大数据技术和另类数据(Alte...

2019-09-11

原创

海王生物提?#35797;?#25928;稳健发展,经营性现金流同比上涨145%

海王生物

2019年上半年,海王生物(000078.SZ)实行“控规模、调结构、提?#35797;?#25928;”的管理原则稳健发展。

2019-09-11

原创

再见,马云

马云商业人物

“让我们期待与马云的再次相见!”

2019-09-10

新摘商业评论

小鹿茶单飞,一场圈地下沉的“成人礼”

小鹿茶

在咖啡之外,将新式茶饮作为新抓手,进军下沉市场,复制第二个“瑞幸”。

2019-09-10

原创

靠一瓶?#20174;停?#19968;夜造就34位亿万富豪,估计只有他能做到

庞康商业人物

1956年,庞康出生在广东佛山,家境很普通,但是自小学习优秀的他,一直平平淡淡的,上学读书,直到大学...

2019-09-10

原创

5G时代,盗梦空间来临?

5G往期会议

“2019第十一届中国光电投资大会暨5G+上市公司产业投资峰会”在深圳会展?#34892;?#26690;花厅隆重举办。

2019-09-10

投资家网(www.xcwnm.club)实时提供专业的创业、投资资讯和深度分析。长?#20174;也?#20108;维码添加"投资哥"可与小编深入交流,并可加入微信群参与官方活动,赶快行动吧。

浪潮之下,先进制造业正蕴含蓬勃机会,蓄势待发

在下午分会场三中,松禾资本合伙人袁宏伟、海通开元董事长张向阳、同创伟业董事总经理关博、创东方投资合伙...

正商参阅、投资家网创始人蒋东文:专注内容+IP,深挖?#27809;?#20215;值

财经内容从业者需要在内容方面专注自己熟悉的领域,同时深挖?#27809;?#30340;价值。

傅盛对话赵何娟:2020是AI产品化一年,服务机器人出货量将大增

12月6日-8日,以“分野与?#24425;丁?#20026;主题的2019T-EDGE全球创新大会在?#26412;?#20030;行,大会由钛?#25945;?#21644;...

25岁成为中国首富,38岁身家1269亿,女版“王?#21363;稀?#30340;另类人生

去年7月至今,杨惠妍通过香港上市公司碧桂园所得的股票分红累计套现89亿元。杨惠妍家族以财富1750亿...

地处三线城市,这家MCN竟然一年内成为抖音最能带货的机构之一!

“想要比别人跑?#27599;歟?#23601;要比别人付出的多?#20445;?#26417;亮对投资家网记者说。

巅峰对决圆满落幕,2019北航全球创新创业大赛鸣金收兵

巅峰对决圆满落幕,2019北航全球创新创业大赛鸣金收兵

12月22日,第三届北航全球创新创业大赛总决赛在京举行。来自各地政府机构、在京高校、顶级投资机构、双...

财经中国2020V峰会聚焦创新,专家、企业?#19981;?#21464;革新机遇

财经中国2020V峰会聚焦创新,专家、企业?#19981;?#21464;革新机遇

12月19日,由?#34892;?#32463;?#25345;?#21150;的“财经中国2020V峰会”在?#26412;?#20030;行。本次会议以“创新的力量”为主题,...

大草原现金试玩
吉祥吉林麻将官网 甘肃任5遗漏 2o2o年今日财神方位查询打麻将 黑龙江11选5彩金 期货配资规则 微乐长春麻将小鸡飞 新疆11选5遗漏 安徽快三 重庆幸运农场开奖直播 河南体彩481走势图最近200期 黑龙江快乐10分走势图 河北十一选五app 南粤风采36选7好彩1 30选5开奖结果今天双色球开奖结果 天津十一选五今天的好 山东11选5开奖时