TechWeb 文/卞海川
把GPT“吹”上车,真的能给用户带来实际价值吗?
【资料图】
众所周知,ChatGPT已经成为全球最快用户破亿的应用,各大科技巨头陆续发布了“类ChatGPT”AI大模型。这其中,AI大模型在智能汽车领域的应用更成为整个汽车行业集体关注的焦点,尤其是国内车企更是趋之若鹜。
车企尽上GPT
据不完全统计,目前仅接入文心一言的车企就包括长安、集度、吉利、岚图、红旗、长城、东风日产、零跑等。除了国内车企,奔驰、微软宣布将在美国奔驰汽车上增加GPT功能。借助OpenAI和微软的技术,奔驰原有车载语音助手将得到升级。
与此同时,国内诸如蔚来汽车、小鹏汽车、理想汽车、奇瑞汽车均申请了GPT相关商标。如蔚来汽车申请“NIOGPT”、小鹏汽车申请“XPGPT”、理想汽车申请“MindGPT”等。 尤其是理想,不久前已经发布了自研Mind GPT,并将AI技术引入到车机“理想同学”中。
可以说,国内的车圈也已经进入了大模型的混战阶段,那么问题来了,这些大模型究竟有何本领?与此前车企们吹捧的智能座舱和智能驾驶又有何区别呢?
GPT上车 价值在哪?
由于接入百度文心一言的车企较多,所以这里我们就以它为例,看看大模型上车到底带来了什么?
结合媒体及官方信息,我们知道,与智能座舱结合,最直观的体现就是在交互上。例如更聪明能听懂人话,包括那些模糊的指代命令,可以和人对话;能通过搜索分析,给出更贴切的反馈;能够提供个性化、拟人化的服务;甚至在文字、语音、图片之间的转换等。
具体到应用场景,包括超级闲聊、灵感画画、百变人设、AI新车导购等。以超级闲聊为例,就是把车内变成一个交流场景,通过与语音助手对话式交互,规划行程、答疑解惑、闲聊,就像人与人交流一样自然。
同时,基于大模型本地化技术,小度车载语音 SDK 支持流畅的免唤醒多路同时交互、全页面所见所说、全域毫秒级响应,这些都让细节的体验升级。特别是真多路同时对话能力,最大支持 8 路同时交互精确处理,覆盖整个座舱内外,可以实现多路同时、快速、连续对话的极限挑战,就算坐在驾驶位、副驾驶位和后排的一家人同时开口,语音助手也能满足每一个人的诉求。
再看理想的Mind GPT ,声称和“理想同学”结合后,支持声纹识别、内容识别、方言识别、出行规划,AI 绘画、AI 计算等功能。
不知道业内看到这些作何感想?在我们看来,除了某些应用场景(例如超级闲聊、多路对话能力、)影响驾车安全,且并非刚需,其他所谓的场景基本上也是此前智能语音的升级,至于到了用户体验上能有多大的提升,还需时间的检验。
其实不止是百度文心一言,目前上车的大模型在智能驾驶座舱方面(基本都是原有语音理解和交互的提升)都是大同小异,很难形成差异化的竞争力和用户体验。
思必驰汽车事业部产品总监葛付江对TechWeb表示,ChatGPT目前是以文本交互机器人的形式呈现的,适用多种文本处理任务,常用于智能问答和对话、文本创作等领域;车载语音以对话交互为主,多用于进行例如“导航去XXX?打开音乐”有明确指令的行动,“语音助手”用高度拟人化的语音输出来回应车主诉求。车载语音交互用于解放驾驶员双手,聚焦其注意力带来更安全、便利的驾驶体验。未来车内有了ChatGPT技术的应用,不仅是完成固定指令的任务型对话,车、人能进行更高效、更直接、高灵活度的出行、知识和闲聊交流。
可以看到,目前GPT上车的价值主要还是局限在智能座舱的语义识别,可是目前国内车企的智能语音助手相对成熟,GPT赋能下的智能座舱很难在带给用户更大提升。况且,一个新的技术或者产品能否最终落地得到规模的应用,除了技术因素外,还会受到其所处产业或者市场的产业链、市场竞争强弱、市场空间等诸多因素密切相关。
具体到车载智能语音系统,虽然ChatGPT在“智能”上表现出色,但其在整个产业链条中比较偏后段,需要依赖很长的前端链条,比如信号处理、语音识别、文字输出之后才会用到它,前端链条上的因素对后端流程都会产生影响,例如信号处理会影响语音识别,语音识别如果出错就会影响NLP的判断,链条上每个模块都需要提高可靠性,才能保证最后出来的整体结果可靠。
也就是说,ChatGPT在“智能”能力的输出上,并非完全取决于自身的能力,其产业链上任何一个环节都会对其造成正或负的影响。
综上所述,无论是从体验提升还是其它因素制约来考虑,GPT在智能座舱层面“加持”有限。
除了上述智能座舱外,值得注意的是,智能驾驶是最早被提出的AI应用场景之一,而自动驾驶需要大量的数据处理和分析,同时自动驾驶的应用也需要长期仿真测试以及道路测试,而AI大模型的加速发展将缩短自动驾驶开发进程,进一步推动产业成熟。
业内知道,早在2019年,特斯拉就将基于深度神经网络Transformer大模型引入到感知预测中,并在2021年8月的特斯拉AI DAY 上展示了基于Transformer的BEV(鸟瞰视角) 感知方案,这是大模型技术首次被应用到自动驾驶行业,也是FSD实现“重感知,轻地图”纯视觉路线的关键所在。
虽然从极少数的内测到如今面向北美所有购买用户推送,最新驾驶里程接近2亿英里,并被认为是目前最先进的自动驾驶系统之一。但时至今日,其在实际的应用中依然是事故频发,远未达到自动驾驶应有的体验。
领先的特斯拉尚且如此,何况现在才开始利用大模型的其他厂商。
写在最后
车企们争相独立布局语言大模型技术以提升汽车智能化(例如智能座舱、智能驾驶等),的举措无可厚非。但从目前几乎主流车企,尤其是国内车企扎堆推出各GPT后的应用场景和体验看,依然缺乏与此前未采用大模型的差异化,而这也让我们不禁发问,车企们在力推语言大模型的时候,到底只是为“乱花迷人眼”,还是应该本质性地提升用户的体验为先?