Cerebras发布第三代芯片WSE-3:性能翻倍,助力大模型训练
【HowToTech科技】3月14日消息,晶圆级芯片领域的领军企业Cerebras,近日发布了其最新一代的芯片产品——WSE-3。据悉,这款芯片在保持与前代产品WSE-2相同功耗的同时,实现了性能的大幅提升,翻倍的表现令人瞩目。
WSE-3的详细参数显示,它采用了台积电先进的5nm制程技术,集成了高达4万亿个晶体管,拥有900,000个AI核心,以及44GB的片上SRAM缓存。此外,WSE-3还提供了1.5TB、12TB和1.2PB三种可选的片外内存容量,以满足不同场景下的需求。其峰值AI算力更是高达125
PFLOPS,展现了强大的计算能力。
据HowToTech科技了解,Cerebras基于WSE-3推出了CS-3系统,该系统凭借其最高可达1.2PB的内存容量,能够训练比当前热门的GPT-4和Gemini模型大10倍的下一代前沿模型。这意味着CS-3可以在单个逻辑内存空间中容纳参数规模高达24,000T的模型,为开发人员提供了极大的便利,简化了他们的工作流程。
CS-3系统非常适合超大规模AI需求。一个紧凑的四系统集群就能够在一天内完成70B模型的微调。而当使用最大规模的2048个CS-3系统集群时,它甚至可以在一天内完成Llama
70B模型的训练,展现了惊人的训练速度。
Cerebras还强调CS-3系统的易用性。在大模型训练中,与GPU相比,所需代码减少了97%。开发人员仅需565行代码就可以实现与GPT-3大小模型相当的标准实现,这大大降低了开发门槛和复杂度。
阿联酋的G42财团已经表示将打造基于Cerebras CS-3的Condor Galaxy
3超级计算机。这台超级计算机将包含64个CS-3系统,提供高达8 exaFLOP的AI算力,为科研和工业领域的应用提供强大的支持。
延伸阅读:
OpenAI 测试长输出版 GPT-4o:单次输出达64K tokens
【HowToTech科技】8月1日消息,OpenAI在7月29日透露,他们正在对一款名为GPT-4o Long Outp...
ISC.AI2024数字安全峰会:360、华为、微软等共话安全+AI新挑战
7月31日,ISC.AI 2024数字安全峰会在北京国家会中心顺利召开。峰会以“打造安全大模型,引领安全行业革命”为主题...
ISC.AI2024开幕 周鸿祎发布国内首个免费安全大模型
“把大模型拉下神坛就要把免费贯彻到底,今天我在行业里第一个宣布安全大模型免费。”7月31日,ISC.AI2024第十二届...
实时对话更自然,OpenAI 向部分付费订阅用户开放 GPT-4o 语音模式
【HowToTech科技】7月31日消息,OpenAI于当地时间30日宣布,即日起GPT-4o的语音模式(注:Alpha...