百川智能发布Baichuan 3:超越GPT-4的中文大语言模型新星
【HowToTech科技】1月29日消息,近日,由前搜狗公司CEO王小川创立的百川智能宣布推出了一款超千亿参数的大语言模型——Baichuan
3。据称,该模型在多项中文任务评测中表现优异,甚至在某些方面超越了GPT-4。
在逻辑推理能力的测试中,Baichuan
3展现出了强大的实力。无论是在MCMLE、MedExam还是CMExam等医疗领域的评测上,其中文效果均超过了GPT-4,被誉为“中文医疗任务表现最佳的大模型”。这一突破性的进展,无疑为中文医疗信息处理领域注入了新的活力。
据HowToTech科技了解,为了训练出如此强大的模型,百川智能团队在Baichuan
3的训练过程中采用了多种创新技术手段和方案。其中包括“动态数据选择”、“重要度保持”以及“异步CheckPoint存储”等,这些技术的运用不仅保证了训练的稳定性,还大大缩短了故障恢复时间,据悉,故障恢复可在10分钟内完成。
除了在技术层面的突破,Baichuan
3还在语义理解和生成能力上进行了进一步的提升。通过“迭代式强化学习”技术,该模型在诗词创作方面展现出了惊人的实力。无论是五言律诗、七言绝句,还是“沁园春”、“定风波”等高难度的宋词文体,Baichuan
3都能生成工整对仗、韵脚和谐的作品,让每个人都能体验到诗词创作的乐趣。
百川智能作为一家成立不到一年的公司,能够在如此短的时间内推出这样一款领先的大语言模型,实属不易。目前,Baichuan
3大模型已经正式上线,并在百川智能官网上提供了试用服务。相信在不久的将来,这款模型将会在更多领域发挥出其强大的实力。
延伸阅读:
OpenAI 测试长输出版 GPT-4o:单次输出达64K tokens
【HowToTech科技】8月1日消息,OpenAI在7月29日透露,他们正在对一款名为GPT-4o Long Outp...
ISC.AI2024数字安全峰会:360、华为、微软等共话安全+AI新挑战
7月31日,ISC.AI 2024数字安全峰会在北京国家会中心顺利召开。峰会以“打造安全大模型,引领安全行业革命”为主题...
ISC.AI2024开幕 周鸿祎发布国内首个免费安全大模型
“把大模型拉下神坛就要把免费贯彻到底,今天我在行业里第一个宣布安全大模型免费。”7月31日,ISC.AI2024第十二届...
实时对话更自然,OpenAI 向部分付费订阅用户开放 GPT-4o 语音模式
【HowToTech科技】7月31日消息,OpenAI于当地时间30日宣布,即日起GPT-4o的语音模式(注:Alpha...