每秒40 Tokens!商汤绝影开创原生多模态大模型车载新时代
【HowToTech科技】7月19日消息,商汤科技在智能汽车领域取得了重大突破。商汤科技联合创始人、首席科学家王晓刚在17日宣布,商汤绝影已成功在行业内率先实现原生多模态大模型的车端部署。这一创新技术的推出,标志着智能汽车在人工智能领域迈出了重要一步。
据了解,商汤绝影的车载端侧8B模型在性能上表现出色,首包延迟控制在300毫秒以内,同时推理速度高达40
Tokens/秒,该技术还能够覆盖主流算力平台。为了支持这一强大功能,商汤绝影专门开发了名为“HyperPPL”的计算引擎。该引擎不仅扩展并支持了主流车载计算硬件,还兼容多种主流操作系统,并能适配多个车载芯片的部署平台。
HyperPPL针对车载多人场景进行了优化。这意味着,在车内多人并发使用的情况下,车端多模态大模型的推理效率并不会明显降低,从而确保了用户体验的流畅性。
据HowToTech科技了解,商汤绝影的技术实力已得到实际应用验证。深圳首条自动驾驶公交线路便采用了商汤绝影的车辆与技术,实现了所有驾驶操作的无人员介入。这一成就不仅彰显了商汤绝影在自动驾驶技术领域的领先地位,也为未来智能交通的发展提供了有力支持。
展望未来,随着技术的不断进步,更高算力的车载芯片即将问世。据悉,明年英伟达将推出上千TOPS算力的车载芯片。基于这一更高算力的计算平台,商汤绝影预计其多模态大模型车端部署方案的首包延迟将大幅降低,同时推理速度也将进一步提高。
延伸阅读:
OpenAI 测试长输出版 GPT-4o:单次输出达64K tokens
【HowToTech科技】8月1日消息,OpenAI在7月29日透露,他们正在对一款名为GPT-4o Long Outp...
ISC.AI2024数字安全峰会:360、华为、微软等共话安全+AI新挑战
7月31日,ISC.AI 2024数字安全峰会在北京国家会中心顺利召开。峰会以“打造安全大模型,引领安全行业革命”为主题...
ISC.AI2024开幕 周鸿祎发布国内首个免费安全大模型
“把大模型拉下神坛就要把免费贯彻到底,今天我在行业里第一个宣布安全大模型免费。”7月31日,ISC.AI2024第十二届...
实时对话更自然,OpenAI 向部分付费订阅用户开放 GPT-4o 语音模式
【HowToTech科技】7月31日消息,OpenAI于当地时间30日宣布,即日起GPT-4o的语音模式(注:Alpha...