电车通的体验分享为我们提供了卓驭科技在北京车展上推出的原生多模态基础模型的实际表现情况。以下是对这次体验的总结和分析:
1. 技术特点:
原生多模态基础模型在底层完成对物理世界通用规律的预训练,支持视频、文本、动作、语音、地图等多种信息的统一输入。
该模型消除了语义翻译带来的延迟与信息损耗,能够实现跨垂类开箱即用、全球零泛化或少泛化。
2. 实际表现:
在宽阔、车流密集但秩序良好的主干道上,系统表现出色,跟车距离和加减速控制自然。
在狭窄小路和复杂交通环境下,系统能够流畅地处理各种情况,如超车、错位通行等,没有出现犹豫或顿挫。
3. 与传统VLA的区别:
传统VLA模型需要经过多个步骤进行信息处理和决策,而原生多模态基础模型则在底层完成了联合预训练,能够直接做出反应。
4. 驾驶体验:
系统在右转时遇到直行电动车,能够像经验丰富的司机一样从容应对,微微降低车速后算准时机通过。
5. 未来应用:
该模型预计将在8月达到量产状态,并能够适配从中高算力平台,支持乘用车、商用车、物流车等多垂类部署。
在商用车和物流车上的应用将减轻司机负担,降低疲劳驾驶风险,提高运输效率,并实现更精准的路线规划和调度。
6. 期待与展望:
电车通对智驾系统在商用车和物流车上的应用表示期待,认为这将大幅提升运输行业的效率和安全性。
这次体验展示了卓驭科技原生多模态基础模型在实际复杂交通环境中的潜力和优势,预示着智能驾驶技术在多个领域的应用前景。随着技术的成熟和量产,我们有望看到智能驾驶系统在更多场景下的实际应用,从而推动整个智能交通系统的发展。