更多精彩 >

语音助手鏖战“全双工?#20445;?#36710;载会是一个好场景吗?

2019-10-22 13:44:40   来源:投资家网专栏  作者:科技响铃说 

摘要:一方面,作为最接近自然交互的形式,全双工已经成为智能语音领域的“香饽饽?#20445;?#21508;大AI语音巨头都在积极布局。

文|曾响铃

来源|科技向令说

一方面,作为最接近自然交互的形式,全双工已经成为智能语音领域的“香饽饽?#20445;?#21508;大AI语音巨头都在积极布局。

另一方面,车载场景的人机交互需求也越来越强烈,在手没有被完全解放的情况下,驾驶员们对更自由、更随性、更解放的语音交互有着更强烈的需求,全双工为应用“刚需”。

与普通生活场景不同,车载环?#36710;撓没?#25163;动操作更加不便捷,而同时又往往有诸多功能操作(例如关窗、开空调)、生活服务(例如导航)、娱乐消遣需求(例如听歌),多样化需求更需要更连续的对话体验——如果每一个指令?#23478;?#21796;醒口令,不但?#27809;?#20307;验不佳,从旁观者看,这种交互方式也颇?#34892;?#23604;尬。

与此同时,有限空间里的司乘对话,多人对话与人机交互叠加,加上驾驶环?#36710;泥性櫻?#26080;疑对智能语音提出了更严峻的挑战。

于是,迫切的?#27809;?#38656;求加上庞大的商业价值空间,以及车企这些年对产品创新的?#26159;螅?#22312;这场全双工的鏖战中,车载语音场景不出预料成了玩家竞逐的焦点,全双工+车载的“搭配”迎来广阔的市场机会。例如,不?#20204;?#30340;重庆智博会上,腾讯云小微就联合腾讯车联展示全双工语音交互技术,让?#27809;?#23545;车载语音助手有了更多的好感和期待。

巨头鏖战全双工,也推动“第三空间?#26412;?#36880;走向台前

目前为止,车载+全双工落地应用?#28304;?#20110;初期阶段,技术研发与应用适配同步进行中。

1、车载全双工,巨头各有玩法姿势

微软在2018年3月底宣布“全双工语音交互感官”已完成产品化落地,“长程语音交互成为可能?#20445;?#21040;2019年8月,又宣布全双工语言交互技术已经通过车载设备完成测试,已经有了几个测试合作汽车厂。

微软的全双工语音及其车载应用是小冰项目的?#26377;?/span>,第七代微软小冰的重心之一是实现车载商用,逐?#25509;傘?#29609;具”转向现?#23548;?#20540;,车载无疑是当下最恰当的选择。

而百度在押宝AI战略的大方向下,全双工技术的推广十分积极。今年7月,小度助手升级的全双工语音已经在小度在家智能音箱产品上使用,且开放赋能给更多智能?#24067;?#32456;端。

入局语音交互领域较早的科大讯飞,在2019年5月底发布了智能物联网操作系统iFLYOS 2.0,也在多个领域开始了全双工交互技术的应用尝试。

今年8月,重庆智博会上,腾讯云小微全双工语音技术也正式对外展示。依靠腾讯云小微这些年在语音技术上的深耕,选择了最为“刚需”的车载场景率先落地全双工交互技术,试图从最符合?#27809;?#38656;求的驾驶场景打头阵,然后进行全域拓展。

车联网与AI助手的结合,也是技术与生态基础上的B+C的搭配,非常符合腾讯在ToB转向过程中的一贯调性。

2、技术推动下,第三空间正由概念走向?#23548;?/span>

在很久之前,汽车就被认为是家庭、工作之外的“第三空间?#20445;?#22312;?#35775;?#31561;汽车文化浓郁的国家,车的第三空间价值十分明显。

但在中国,日常出行的属性仍然占据大头,?#27809;?#36827;入车内,听音乐、导?#20581;?#35843;空调……在不用重复唤醒的情况下,很自然完成一套操作……把全双工放到车载场景中,如果从汽车角度看,?#23616;?#19978;是“第三空间”的一?#26234;?#21270;。

抛开技术,从具体场景?#23548;?#26469;看,巨头们在全双工领域的布局和竞争,也在推动“第三空间?#26412;?#36880;走向台前,谁能让?#27809;?#30495;正体会到车上服务的便利,挖掘这个空间的?#27809;?#20215;值,谁就能在车载场景中实现商业突围,这本身也与汽车厂商求新、求变、谋求市场增量的需求相吻合。

第三空间的体验塑造,将面对?#27809;?#30171;点的“三重区分”的挑战

离开汽车视角,从全双工技术视角来看,其面临的首要挑战在于,如何在连续对话中还能拥有很高准确率和响应速度。

例如,从已有资料看,腾讯云小微的全双工语音交互技术,在30秒到90秒的时间?#27573;?#20869;(?#27809;?#33258;行设定),一次唤醒即可实现连续对话,过程中?#27809;?#21487;以随时打断机器的回答。

而除了全双工的特殊能力,腾讯云小微可实现车载复杂噪声环境下唤醒率97%以上,语音识别准确率96%以上,意图理解准确率高达98%。

这里不去?#21592;?#36825;些数字的优劣,毕竟多数语音助手都能拿出还不错的成绩,但它们至少说明 “全双工”交互下,准确率仍能保?#25351;?#27700;准。不过,在汽车有限的第三空间里塑造?#27809;?#20307;验,语音助手们还有三大硬骨头要?#23567;?#23454;现?#27809;?#30340;三种“区分”需求。

1、在几何?#37117;?#26415;?#35759;?#21319;级的基础上,区分“情?#22330;?/span>

腾讯云小微称包括播放音乐、导?#20581;?#26597;股票、查天气等众多服务在内,?#27809;?#37117;可以通过语音指令,跟车机一次唤醒、连续应答、自然交互,这其中涉及一个很重要的问题:跨情?#36710;?#20840;双工服务。

目前的车载语音助手已经可以做到在一定场景内免唤醒,例如常用的听音乐,想听A歌曲又反悔,想听B歌曲,机器自动识别不需要?#27809;?#22810;次唤醒。

而当场景需求延展后,全双工语音技术就不得不面临既要连续、又要跨情?#22330;?#24605;考”的挑战,而这又几乎是汽车体验的必须,内容、导?#20581;?#26597;询、设备控制……区分场景是“全双工”的必要技能。

很明显,即便是人的沟通在转换话题时也需要适应,机器在面临这?#26234;?#22659;跨越的全双工语音时,其?#35759;?#26159;乘法级的几何提升,而非仅仅做叠加而已。

2、在复杂的对话环境中,区分“人”

与?#35775;?#19981;同,在当下中国汽车文化中,家庭单位属于仍然强于个人单位,“每家都有车”而不是“每人都有车”。很多时候,车中不只有司机,而肯定有副驾驶等其他乘客。

所?#20581;?#31532;三空间”不只是为司机服务,也为所有乘?#22836;?#21153;。

对车载全双工而言,这又带来一个特殊的问题,如何让不同的人有属于自己的完整体验。如果把全双工比作一个人,与之沟通时,司机或乘客肯定都希望他与自己的沟通是完整的。

从当前的解决方式来看,行业主要采用多音区设置:主驾唤醒之后,都是听主驾的声音,副驾的唤醒后,都是听副驾的语音,理论上,另一个人要接入全双工交互,必须重新唤醒,才可以开启自己的完整对话体验。严格来说,这是通过物理设置的替代性方案,并非机器对不同声音的完全识别,而是通过声音的来源区分“人”。行?#30340;?#20063;正在发展的“声纹识别技术?#20445;?#30452;接辨别不同的?#27809;В?#25110;才是未来更为彻底的解决方案,不过这仍需要等待。

3、在丰富多样的服务中,区分“需求”

智能语音从一开始就是?#25945;?#33151;走路:前端听懂?#27809;?#35828;了什么,后端根据?#27809;?#30340;个性化需求推荐给不同的内容、服务,或者执行某些操控指令。

放到车载全双工这里,其实问题拓展到了两个层面:

怎么听懂是对机器说的,而不是对其他人说的(?#28909;?#20154;和人聊天),不要误解?#27809;?#30340;需求;

在确定是对机器的需求后,如何实现更为个性化的服务输出,毕竟,如果?#27809;?#24819;吃点?#19981;?#21507;的,你随便导航到了一个?#27809;?#19981;?#19981;?#30340;店子,或者甚?#21155;没?#24819;要去放松一下,你给导航到了公司,这样的连续交互也就失去了意义。

前者需要语音识别能力的极大加强,它还?#34892;?#22810;细节需要用技术实现,例如腾讯云小微称其借助云端大脑,不但能理解?#27809;?#30340;话哪些是需要响应的指令,哪些只是?#27809;Ф员?#20154;说的话,这其中同样涉及复杂场景需求问题,懂更多还要区分是不是需求,挑战进一步升级。

后者,?#23616;?#19978;可以视为个性化推荐机制的?#26377;?#32771;验的语音助手背后的?#25945;?#25968;据能力,如何在尽可能短的时间内了解眼前的?#27809;В?#20026;其提供定制化服务,强化全双工的“实质”支撑,而不是只有花架子。腾讯云小微打出“懂你所需”的旗号,通过训练后推?#25237;?#21046;化服务内容,这是全双工技术的行业必然,只是看谁能更为准确。

对?#27809;?#32780;言,同样是自然的交互,如同与人交流一样,与一个“懂你所需”的全双工语音助手交互,就像是熟人聊天,而与无法实现定制化服务输出的机器交互,就像是在和陌生人聊天,其体验差距无需多言。

全双工语音助手趋势不可避免,车载只是拼图的一块

几乎不会有人否认,语音助手是人机交互必然趋势。经过几年的发展,在巨头们的努力下,越来越高的语音识别准确率,各?#25945;?#39130;出的准确?#25163;副輳?#26412;身就证明机器的“听见”和“听懂”已经逐步实现,剩下的是不断完善的过程。

而“智商”问题一旦接近解决,“情商”问题就走向台前,让机器更贴近人,实现人性化、情感化,是语音助手必然的趋势。

于是,全双工等新技术不断涌现。几乎可以肯定的是,在未来,一方面全双工必然要突破参数瓶?#20445;?#20363;如没有30秒、90秒的区分,而是?#23604;?#36830;续同时准确识别需求,就是如科幻片机器人管家那样的无缝交互,这是语音助手发展的必然;另一方面,更多其他的科技将不断涌现,例如多模态识别,将声音、图像、环?#36710;?#35832;多因素整合来与?#27809;?#33258;然交互。

而显然,虽然车载急迫需要全双工等更多自然交互技术,但全双工并不只会局限于车载。几乎所有巨头的全双工技术的“理想”都是全场景应用,即便是腾讯云小微选择以车载为典型,未来也必将在全领域发力——到目前为止,在出行领域之外,腾讯云小微凭借全栈AI能力及腾讯丰富的内容?#22836;?#21153;生态,在文旅、政务、教育、智能?#24067;?#31561;多个领域都有涉猎。

?#26434;布?#20026;例,腾讯云小微AI应用解决方案已经输送?#20132;?#22120;人、智能电视、智能音箱、智能空调等多个?#25918;?#22810;款产?#20998;校?#32780;且百度、科大讯飞、阿里等玩家都在积极布局。

可以说,车载是全双工最热的局部战场,未来的全双工将是全领域的战争,届时,当物联网真正全面落地时,汽车这样的第三空间将融入一个相互连接、不分彼此的“唯一空间?#20445;?#36710;载全双工与家居、工作全双工联动,人与虚拟数?#36136;?#30028;将实现无缝对接。

拭目?#28304;?#21543;。


原创

那个被徐小平欣赏,带娃创业8年的北大才女,被指“涉嫌传销”

刘楠商业人物

那个被徐小平欣赏,带娃创业8年的北大才女,被指“涉嫌传销?#20445;?

2019-06-26

福安药业优化产品布局结构,抢攻工业大麻医药应用领域

福安药业

今年以来A股工业大麻行情主要受美股带动,38家工业大麻概念股普?#24688;?#20316;为工业大麻概念股之一的福安药业,...

2019-06-26

美淼环保沈敏:牵手绿色技术银行服务一带一路,十年备有用武之地

美淼环保

6月14日,2019年中国绿色产业创新论坛在上海绿色技术银行总部举行。作为国内绿色技术的标杆企业代表...

2019-06-26

首届天眼读书节 16本行业?#19981;?#20070;籍1元包邮到家

天眼读书节

?当国内外汇行业现状还一片混乱时,外汇天眼注意到了投资者虚无缥缈的资金安全问题,推出了外汇天眼APP...

2019-06-26

宁波第三届生命健康创业创新大赛震撼来袭,华?#27604;?#21306;阵容空前

健康创业创新大赛

?以“智汇南湾,甬赢未来”为主题的中国·宁波第三届生命健康创业创新大赛---华?#27604;?#21306;预选赛,将于20...

2019-06-26

Plug and Play中国布局深圳,发布粤港澳大湾区生态战略

Plug and Play

投资家网6月25日消息,Plug and Play中国在深圳科兴科学园国际会议?#34892;?#20030;行“Plug a...

2019-06-26

陈峰

我们?#19981;?#30340;ME TOO策略是什么样的?

ME TOO

最近,和同业交流发现一个现象:很多新药投资人都?#19981;?#35762;抢赛道,?#28909;鏟ROTAC方向一定要投一家,溶瘤病...

2019-06-26

汇源Openday?#25945;?#34892;:为汇源大农业点赞

汇源Openday

?6月22日,多家?#25945;?#24212;汇源邀请,前往密云有机生态园参加“汇源Openday?#25945;?#34892;”活动。从参观游览...

2019-06-26

原创

湘潭大学顾敏康:应当区分催收行业与高利贷、套?#21453;?#31561;

顾敏康

6月18日,“个人信贷催收行业规范发展研讨会”在?#26412;?#20030;办,会议由?#26412;?#20449;用协会主办、中国消费信贷催收行...

2019-06-26

原创

李爱君:催收行业规范的终极目标是契约精神与诚信社会

李爱君

6月18日,“个人信贷催收行业规范发展研讨会”在?#26412;?#20030;办,会议由?#26412;?#20449;用协会主办、中国消费信贷催收行...

2019-06-26

投资家网(www.xcwnm.club)实时提供专业的创业、投资资讯和深度分析。长?#20174;也?#20108;维码添加"投资哥"可与小编深入交流,并可加入微信群参与官方活动,赶快行动吧。

光大控股艾渝:AIOT进化论——?#24403;?#26234;能化时代的战略引擎

Super Return Asia?#23616;?#22312;香港举行,光大控股董事总经理、新经济负责人、特斯联CEO艾渝...

阿里前CEO:创投四大陷阱,BAT以前是地主,现在快成“大恶霸”

“BAT是三座大?#20581;?#23601;像三大地主,你只要一碰互联网,?#27809;?#37117;在这三个手里,你很难从他们手上圈?#27809;?#22280;地了...

明势资本黄明明:CLOUD NATIVE正在重构商业组织

9月6日,明势资本在?#26412;㏕he Future Hall举办了“产业升级黄金十年之企业服务专场”。

天风天睿陈实:立足产业深耕高端制造,不能抱着“赌徒心态”做投资

通过构建“人人受益的产融生态”为愿景,天风天睿致力于通过产业整合和资本运作,推动被投企业可持续化成长...

5年打造无数“爆款?#20445;没?#36229;700万的创米,发力智能门锁!

随着智能门锁玩家的逐渐增多,行业分成了三大阵营,各具特色——以创维、美的为代表的传统家电阵营,以凯迪...

2019西安全球硬科技创新大会10月30日开幕

2019西安全球硬科技创新大会10月30日开幕

10月30日,2019西安全球硬科技创新大会在西安开幕。

?群星璀璨,大咖云集——投资家网专项闭门?#36153;?#20250;成功举办

?群星璀璨,大咖云集——投资家网专项闭门?#36153;?#20250;成功举办

这不仅仅是一场高质量的项目?#36153;?#20250;,还是一场资深投资人的聚会。

接轨大上海,融入长三角吴中(上海)现代服务业宣传推介会圆满举行

接轨大上海,融入长三角吴中(上海)现代服务业宣传推介会圆满举行

上海与苏州地缘相近、人文相亲,因江与湖的交融汇通,早已有着深厚的历史渊源和割舍不断的经济联系。

“2019 DEMO CHINA创新中国?未来科技节”在杭州隆重举行

“2019 DEMO CHINA创新中国?未来科技节”在杭州隆重举行

9月18日上午,由创业邦主办的“2019 DEMO CHINA创新中国?未来科技节”在杭州未来科技城...

「?#37117;渴丁?#33829;销科学大会2019」10月16日与你相邀上海,报名开启

「?#37117;渴丁?#33829;销科学大会2019」10月16日与你相邀上海,报名开启

天有四时,春生夏长,秋收冬藏。人类探索世界,从原始文明到人工智能时代,不断进化演化,总结规律,建设科...

大草原现金试玩
买广东11选5 菜鸟代收快递怎么赚钱 幸运飞艇开奖 000408股票行情 腾讯分分彩计划助赢 325游戏棋牌下载 江西多乐彩11选5中奖规则 股票推荐买入 20180205035山东群英会 试玩赚钱推广平台源码 贵州十一选五一定牛 银行维护 赚钱不进吗 天津十一选五计划软件手机版式 在山边养什么赚钱 黑龙江11选5投注技巧 新加坡快乐8开奖网址