元戎启行完成1亿美元C1轮战略融资
2024年11月5日,深圳元戎启行科技有限公司(以下简称“元戎启行”)宣布完成1亿美元C1轮战略融资,由国内头部主机厂独家投资。据介绍,本轮融资将用于夯实国内量产项目,拓展海外业务,同时为探索Robotaxi商业化运营和布局VLA模型等前沿技术提供资金支撑。
此笔融资在前几日已有风声传出,并有消息表明该“国内头部主机厂”即长城汽车。包括C1轮融资在内,元戎启行已完成6轮融资,累计融资金额超5亿美元。股东包括复星锐正、云启资本、阿里巴巴、耀途资本和东风资产等。
元戎启行核心研发团队是业内最早从事人工智能研发及落地的团队之一,其相继推出“无图”方案、端到端智能驾驶模型DeepRoute IO。
目前,元戎启行已成功将端到端模型部署上车,并与多家主流车企达成合作,共同推进十余款车型的量产合作。预计今年年底,将有三款搭载元戎启行智能驾驶系统的车型推向消费者市场。同时,元戎启行将利用其在国内的量产经验赋能海外车企业务发展。
据悉,接下来元戎启行将基于英伟达Thor芯片进行VLA模型(Vision Language Action Model,视觉语言动作模型)的研发,模型预计将于2025年正式推出。
据介绍,元戎启行的VLA系统可以连接视觉、语言、动作,能识别和描述道路环境、交通标志、道路参与者等,理解交通场景中复杂的交互事件、隐藏的语义信息和逻辑推理,即便碰到罕见路标跟边缘场景,系统也能有高效的场景泛化能力和稳定的驾驶表现。
元戎启行方面认为,纯视觉的端到端(VLM)缺乏可解释性,无法解释驾驶决策逻辑。碰到潮汐车道、限行时段等罕见路标/边缘场景难以用常识理解读懂,这种情况下很难推理出好的驾驶决策。
而VLA具有场景理解能力,能通过语音、文字形式对自己的驾驶行为和推理进行描述,让驾驶行为更智能,更从容,更拟人。作为融合了视觉、语言和动作的多模态模型,VLA模型可提高模型的泛化能力和判断推理能力。不仅限于汽车,未来,VLA还能移植到机器人等更多载体上,实现物理世界的通用人工智能。
与此同时,元戎启行正在探索新的商业化路线——基于端到端模型,用量产车实现Robotaxi规模化运营。与传统的Robotaxi不同,元戎启行目标实现的Robotaxi不受运营区域的限制,在时间成本和经济成本上更具优势,更有助于市场普及和加快Robotaxi的落地进程。