每秒40 Tokens！商汤绝影开创原生多模态大模型车载新时代

科技前沿 2024-07-19 大鱼手机阅读

【HowToTech科技】7月19日消息，商汤科技在智能汽车领域取得了重大突破。商汤科技联合创始人、首席科学家王晓刚在17日宣布，商汤绝影已成功在行业内率先实现原生多模态大模型的车端部署。这一创新技术的推出，标志着智能汽车在人工智能领域迈出了重要一步。

据了解，商汤绝影的车载端侧8B模型在性能上表现出色，首包延迟控制在300毫秒以内，同时推理速度高达40
Tokens/秒，该技术还能够覆盖主流算力平台。为了支持这一强大功能，商汤绝影专门开发了名为“HyperPPL”的计算引擎。该引擎不仅扩展并支持了主流车载计算硬件，还兼容多种主流操作系统，并能适配多个车载芯片的部署平台。

HyperPPL针对车载多人场景进行了优化。这意味着，在车内多人并发使用的情况下，车端多模态大模型的推理效率并不会明显降低，从而确保了用户体验的流畅性。

据HowToTech科技了解，商汤绝影的技术实力已得到实际应用验证。深圳首条自动驾驶公交线路便采用了商汤绝影的车辆与技术，实现了所有驾驶操作的无人员介入。这一成就不仅彰显了商汤绝影在自动驾驶技术领域的领先地位，也为未来智能交通的发展提供了有力支持。

展望未来，随着技术的不断进步，更高算力的车载芯片即将问世。据悉，明年英伟达将推出上千TOPS算力的车载芯片。基于这一更高算力的计算平台，商汤绝影预计其多模态大模型车端部署方案的首包延迟将大幅降低，同时推理速度也将进一步提高。