全球首颗Transformer AI芯片Sohu发布:每秒处理速度达50万tokens
【HowToTech科技】6月26日消息,近日,Etched公司成功完成了1.2亿美元(折合人民币约8.73亿元)的A轮融资,这笔资金将被投入到全球首款专为Transformer架构设计的ASIC芯片——Sohu的开发与销售中。
Etched公司,这家由哈佛大学辍学生加文・乌伯蒂(Gavin Uberti)和克里斯・朱(Chris
Zhu)创立、运营时间不足2年的初创企业,正以其独特的技术视角和创新力量,引领着人工智能硬件的新潮流。
据HowToTech科技了解,Sohu芯片的最大突破在于它直接将Transformer架构蚀刻到芯片中,从而实现了硬件与算法的深度融合。乌伯蒂透露,Sohu芯片采用了台积电的4纳米工艺,这使得其推理性能显著优于传统的GPU和其他通用AI芯片,同时在能耗方面也有更出色的表现。
在性能测试中,以Llama
70B为基准,Sohu芯片每秒能处理超过50万个tokens,这一速度为用户构建出了GPU无法实现的产品提供了可能。此外,Sohu还具备实时语音代理、毫秒级处理大量文本、强大的代码树搜索、并行比较多个响应、多播推测解码以及实时生成新内容等先进功能,为运行未来万亿级参数模型铺平了道路。
延伸阅读:
OpenAI 测试长输出版 GPT-4o:单次输出达64K tokens
【HowToTech科技】8月1日消息,OpenAI在7月29日透露,他们正在对一款名为GPT-4o Long Outp...
ISC.AI2024数字安全峰会:360、华为、微软等共话安全+AI新挑战
7月31日,ISC.AI 2024数字安全峰会在北京国家会中心顺利召开。峰会以“打造安全大模型,引领安全行业革命”为主题...
ISC.AI2024开幕 周鸿祎发布国内首个免费安全大模型
“把大模型拉下神坛就要把免费贯彻到底,今天我在行业里第一个宣布安全大模型免费。”7月31日,ISC.AI2024第十二届...
实时对话更自然,OpenAI 向部分付费订阅用户开放 GPT-4o 语音模式
【HowToTech科技】7月31日消息,OpenAI于当地时间30日宣布,即日起GPT-4o的语音模式(注:Alpha...