智能相对论
作者| Leo Chen
日前,微软宣布了一项重量级收购,斥资160亿美元收购Nuance,这也是微软继260亿美元收购Linkedin之后的第二大收购案。Nuance是美国最大的语音识别公司,被称为美国版的科大讯飞(002230,股吧)。
除了Nuance自身在医疗领域的能力外,其分拆独立上市的汽车语音部门Cerence也是此次收购的幕后推手之一。这不禁表明,在未来,微软将在汽车语音方面采取一些行动。也许这是微软在汽车行业的一次秘密“登陆”。
目前,全球科技巨头正在向智能汽车行业扩张,车内语音交互赛道也发生了翻天覆地的变化。
从触摸到语音,
引发供应商互动纠纷
随着智能电动汽车的兴起,驾驶舱变得更加智能,越来越多的车辆配备了具有大量功能和不同级别驾驶辅助的车机系统,导致驾驶舱信息爆炸。面对海量的信息,智能汽车的中控屏幕越来越大。
但仔细想想,这些屏幕的内容高度集中,有多个层次,信息的输出是高效的,而信息的输入显然是低效的。理论上,语音交互可以有无数指令,并且可以在一步中实现任何功能。因此,语音交互的价值再次显现出来。
根据高科智能汽车研究院的监测数据,2020年,中国在汽车前部配备语音识别和交互功能的新车数量为1206.4万辆,同比增长17.88%。在搭载率方面,已从2019年的49.82%增长到63.25%,车内语音已经成为继中央控制屏幕之后的第二种车内交互方式。
事实上,在过去的两年里,语音交互迎来了新一轮的发展,不仅因为它比屏幕交互具有独特的优势,还因为它可以实现与“智能”的深度融合,升级为“语音助手”。
与智能汽车相连的生态服务资源广泛,驾驶员和乘客使用服务的频率越来越高。语音交互系统可以从中获取大量数据。数据来自司机和乘客的日常对话,这些对话相对丰富和详细。经过深度学习和培养,系统变得更加“智能”。
这与屏幕交互非常不同,因为数据不可避免地会加速汽车交互系统的更新迭代。交互式系统用户体验的改善将进一步增加驾驶员的使用频率,并产生新的数据。两者相辅相成,相互促进。
另一个不同之处在于,语音助手可以更好地与内容生态系统连接,将移动互联网产品和服务转移到汽车上,并突出自身业务系统的优势。这也是汽车制造商除了体验之外,还专注于语音交互的一个关键驱动力。
但随着产品的不断进步,汽车语音供应商之间的竞争越来越激烈。在技术环节,语音交互一般包括声学前端、语音识别、自然语言处理等。目前的竞争不仅集中在自然语言处理上,还源于其背后的数据和计算能力的竞争。
根据2020年的数据,前八大供应商的市场份额超过99%。Cerence和科大讯飞继续占据前两大市场份额,总份额超过70%,但数量已开始出现下降迹象;
百度以7.24%的份额位居第三。
目前这方面的问题是,在一些高频对话中,整体效果不错,但在一些低频对话中,由于语料库和数据量不足,体验不尽如人意。如何利用人工智能更好地促进自然语言处理,对公司的技术研发实力和积累提出了很高的要求。
因此,该领域具有天然的竞争壁垒,尤其是先发优势和规模效应。这是英美烟草等科技巨头无法实现快速渗透和提高市场份额的主要原因。
Cerence是目前世界上唯一一家专注于这一方向的企业,拥有20多年的技术积累,平衡了科技巨头和小众玩家的优势。一方面,科技巨头早就具备了从生态角度整合第三方应用协作的能力,利用认知仲裁技术实现系统上第三方内容的共存,简化了辅助任务执行的流程。
另一方面,凭借科大讯飞等传统企业丰富的集成经验和规模优势,我们与全球主流原始设备制造商和一级供应商合作。这不仅有助于加强成本优势,也有助于积累丰富的语言数据。目前,Cerence和科大讯飞已经建立了数十种语言的语音数据库。
汽车制造商的不同实施路径,
带来不同的想象空间
汽车已经进入了数字化和自动驾驶的新时代,电子架构从分布式架构转向领域集中架构,再转向跨领域集成。汽车制造商开始获得更多的主导地位。随后,当作为需求侧制造商与语音供应商合作时,他们不再仅仅依赖通用解决方案,而是转向对应用场景的更深入理解和联合深度定制。
在“智能相对论”看来,未来汽车制造商的语音助手前端解决方案将有两条主要实现路径:
一方面,一些公司会倾向于建立自主开发的交互平台,并整合科大讯飞和思必驰等多家供应商的优势技术支持。
自我研究的缺点在于成本。改变核心领域的交互逻辑,构建语义处理能力,需要持续的研发投入。为了为系统创造强大的智能人工智能服务,大量的数据沉淀也会延长系统的更新周期。
一些制造商选择“向虎山出行倾斜”,原因简单概括为“闭环”一词。
与向供应商采购相比,自主开发的平台进一步符合车辆的特点,具有相对自由的权限和更好的适应性。同时,它的迭代升级会更快,响应速度也会更快。如果我们想实现“全双工”、“连续对话”、“免唤醒”、“全场景”等更好的技术能力,自我研究就显得尤为重要。
一些制造商会选择这种实施路径,以便更好地把握行业的长期趋势。由于汽车的生产周期很长,如果制造商不能“独特而有洞察力”,那么安装在未来汽车上的语音解决方案就会过时,与同期产品相比会失去一些竞争力。
最典型的例子是以蔚来、理想、小鹏为代表的造车新势力。他们仍然需要依赖语音供应商,但自我研究的比例正在逐渐增加。
NIO拥有搭载NOMI Mate迷你机器人的车载AI系统,现已升级至2.0版本,解锁更多功能和表情符号。NIO早些时候选择了汽车语音“拟人化”的想法,这是独一无二的,但它确实达到了预期的效果,并引发了许多后续的模仿。通过拟人化,语音被抽象为人物形象的情感表达,从而加深用户对品牌的印象。
小鹏的“游戏性”似乎是“直接的、硬核的”。去年10月,它发布了自己的全场景语音,包括四个功能:多回合对话、语义中断、双区锁定和可视通话。在技术层面,小鹏已经独立搭建了一个语音框架,用于d……
在不受供应商开放能力限制的情况下,实现语音的全过程体验。但必须承认,这需要在人力、物力和财力方面进行长期投资。
另一方面,其他品牌倾向于直接或间接选择提供整体解决方案的供应商,如Cerence、iFlytek、BAT和其他供应商。
总体来说,只需少量定制即可交付整体解决方案,特别适合车型种类和数量繁多的汽车品牌,性价比相对较高。
目前,吉利汽车和长城汽车(601633,谷霸)等中国自主品牌主要走这条路。以长城汽车为例,去年4月,其战略合作伙伴仙豆智能选择了Cerence ARK提供数字助理解决方案。在与全球领先供应商建立合作后,国产品牌的声音互动不亚于造车新势力。
在这种语音交互“智能化”的趋势下,梅赛德斯-奔驰、奥迪、宝马等传统豪华品牌并不掌握话语权,这与国内消费者对它们根深蒂固的认同感形成了强烈对比。
传统豪华品牌在汽车数字化方面相对保守,往往会从某个车系中选择一款车型来尝试升级。不选择自我研究可以显著缩短开发周期,再加上我们自己的汽车生产能力,我们可以快速将产品推向市场。
2020款奥迪A4L语音系统由Go Ask提供,并配备了Cerence和天猫精灵的相关功能。整体体验优于其他豪华品牌,但远未被视为第一梯队。
Cerence和Go Ask分别为这款车提供了一套ASR和NLU功能,这可以被视为一种平行关系。因此,当用户输入任何命令时,两个通道都需要运行一次,最后命令的执行口径统一,导致流畅性较差。
目前,传统豪华品牌的智能化升级迫在眉睫,车内人机交互体验成为各大厂商竞争的焦点。新势力搅动市场,自主品牌发力,导致智能汽车市场竞争激烈。
下一代交互侧重于“主动多模态”,
仍然需要克服“鸡肋”的障碍
激烈的竞争在一定程度上推动了语音交互产品提高用户体验,也导致越来越多的用户长期接受这种交互方式。在智能电动汽车时代,“软件定义汽车”这句话深入人心,但“声音”远不能定义互动。
在整个汽车底盘的顶部,还有摄像头、HUD、玻璃、大灯和其他互动产品,这些产品有望成为未来的驾驶舱终端产品。语音交互可以承载大量数据(603138,股票吧),带来更高的驾驶安全性等等,这将是交互产品生态系统的中心。
因此,“智能相对论”认为,以语音交互为中心的“主动多模态交互”将是未来的方向。
具有不同功能的相机就像多对“眼睛”,可以进行手势识别、情绪识别并找到你的需求。在这种情况下,相机带来了一个“主动”提供服务的交互系统,这与其他交互模式完全相反。当语音作为一种“被动”和视觉“主动”的融合,整个互动产品生态系统将为用户提供更丰富的服务和信息。
例如,集成车辆、行人、车道和标志识别导航信息进行实时渲染,提供驾驶警告和导航引导等一系列功能,并通过HUD将其投影到挡风玻璃上,带来更直观的导航驾驶体验。
同时,车厢内的座椅、照明、空调、音乐等所有功能都通过视线跟踪、手势交互等操作进行控制,在确保安全驾驶的同时,使人机交互更易于使用。此外,结合面部识别和身份认证技术,提供驾驶员身份检测,支持个性化功能实现。
视觉……
虽然很漂亮,但现实是,目前只有少数几个案例可以实现视觉交互。宝马的手势识别于2015年首次登陆宝马7系,并于2019年降至3系。通过摄像头,它主要识别和确认、调整音量、接听和挂断电话。识别率很高,但屏幕系统的流畅度和响应都很流畅,手势识别相当弱。
如何平衡言语和视觉等多种模态之间的互动逻辑,是目前各学派都在探索的问题。
体验不均衡且不紧迫,导致整个产品生态系统的价值没有得到真正的凸显。最重要的是,言语和视觉并没有从根本上融合在一起,它们仍然处于单打独斗的状态。
功能的集成并不容易,尤其是从被动指令到主动提供服务,这需要成熟的人工智能技术的支持。如果能做好这项细微的服务,体验会大大提高,用户粘性也会相应增加。
如果我们把技术放在一边,首先考虑交互,那就是提供更多的服务。这项服务背后有一个广泛的内容生态系统,包括社交媒体、地图、音乐等。因此,如果能够为用户提供更多的生态内容服务,互动产品生态的数据将逐渐积累,人机交互也将变得更加智能。这不可避免地需要多方的共同努力。
*本文中的所有图片均来源于互联网
本文首发于微信公众号:智能相对论。文章内容属于作者个人观点,不代表和讯网络的立场。投资者应据此操作,并承担风险。
经济观察网记者周菊国内出租车网约市场最大的两家公司同时传出IPO新动向,这使中国共享出行“第一股”花落谁家成为一大看点。
1900/1/1 0:00:00虽然关于特斯拉“自动辅助驾驶”酿造车祸的争议最多,但是在不少车主及消费者共识中,特斯拉的自动辅助驾驶,是目前电动车品牌中,体验及功能性最优异的之一。
1900/1/1 0:00:00十年之前,每家公司都是互联网企业;十年之后,每家公司都是车企。诸位最近可能有这么个感想:等到了今年年底,恐怕就找不到哪家互联网公司、房地产企业居然不造车了。
1900/1/1 0:00:00日前,坦克品牌公布了一组坦克300游侠版车型的预告图,新车是坦克官方与我国知名越野改装厂运良联合打造,预计将于4月19日开幕的上海车展首发亮相。
1900/1/1 0:00:00作为吉利的高端品牌,领克近些年来推出了不少爆款车型,领克03、05、01、02在市场上都有不错的销量表现。
1900/1/1 0:00:00新浪科技讯北京时间4月14日下午消息,据报道,虽然许多在全球范围内占据主导地位的科技企业都来自美国,但是在汽车行业中,大多数美国车企依然在销售老旧的内燃机技术。
1900/1/1 0:00:00