百川智能发布Baichuan 3：超越GPT-4的中文大语言模型新星

科技前沿 2024-04-16 大鱼手机阅读

【HowToTech科技】1月29日消息，近日，由前搜狗公司CEO王小川创立的百川智能宣布推出了一款超千亿参数的大语言模型——Baichuan
3。据称，该模型在多项中文任务评测中表现优异，甚至在某些方面超越了GPT-4。

在逻辑推理能力的测试中，Baichuan
3展现出了强大的实力。无论是在MCMLE、MedExam还是CMExam等医疗领域的评测上，其中文效果均超过了GPT-4，被誉为“中文医疗任务表现最佳的大模型”。这一突破性的进展，无疑为中文医疗信息处理领域注入了新的活力。

据HowToTech科技了解，为了训练出如此强大的模型，百川智能团队在Baichuan
3的训练过程中采用了多种创新技术手段和方案。其中包括“动态数据选择”、“重要度保持”以及“异步CheckPoint存储”等，这些技术的运用不仅保证了训练的稳定性，还大大缩短了故障恢复时间，据悉，故障恢复可在10分钟内完成。

除了在技术层面的突破，Baichuan
3还在语义理解和生成能力上进行了进一步的提升。通过“迭代式强化学习”技术，该模型在诗词创作方面展现出了惊人的实力。无论是五言律诗、七言绝句，还是“沁园春”、“定风波”等高难度的宋词文体，Baichuan
3都能生成工整对仗、韵脚和谐的作品，让每个人都能体验到诗词创作的乐趣。