升级开源大模型，百川智能继续赶路

百度首页

作为后来者，百川智能以产品快速迭代的形式换时间。9月6日，百川智能发布了baichuan-7B 和baichuan-13B大模型的升级版。以百川智能CEO的身份入局大模型赛道之后，王小川差不多一个月发布一款大模型产品，既有开源的也有闭源的。如同iOS与安卓一样，未来大模型生态大概率会开源闭源并存，百川智能也没有拘泥于一种技术处置方式。但在客户选择上，百川智能更偏向B（企业)端。对于创业公司而言，这更像一种默契，绕过了场景尴尬，缩短了变现时间。

9月6日，百川智能正式开源微调后的Baichuan2-7B、Baichuan2-13B、Baichuan2-13B-Chat与其4bit量化版本，均为免费可商用。

Baichuan2-7B-Base 和 Baichuan2-13B-Base，均基于2.6万亿高质量多语言数据进行训练， Baichuan2-13B-Base相比上一代13B模型，数学能力提升49%，代码能力提升46%，安全能力提升37%，逻辑推理能力提升25%，语义理解能力提升15%。根据MMLU等多个英文评估基准评分，Baichuan2-7B以70亿的参数在英文主流任务上与130亿参数量的LLaMA2持平。

百川智能成立于2023年4月10日，6月中旬开始对外发布大模型产品，包括Baichuan-7B、Baichuan-13B两款开源免费可商用的中文大模型，以及一款搜索增强大模型Baichuan-53B，目前两款开源大模型下载量已超过500万次。

在现场，王小川展示了百川大模型在安全、代码、数字计算、推理和语义相关的能力，强调了开源对学术研究等方面的作用。

站在行业的角度，负责技术业务的APUS副总裁邓小波向北京商报记者解读了开源和闭源区别，“开源、闭源是对技术的处置方式，跟客户场景没有直接相关的联系”。

尽管当日的主题围绕着开源，但王小川并不纠结于开源闭源，他认为，“这不是竞争关系，而是不同产品间的互补关系”。对于服务对象，王小川也很明确，这些大模型不是定位为to C（用户）的沙盒型产品，本质上更多是to B服务。

不止王小川，越来越多的从业者都在强调自己在企业级市场的能力。前一天，把企业级的千帆大模型平台升级到2.0版本的百度智能云，就是最新的例子。在大模型发布现场，百川智能与腾讯云、阿里云、火山方舟、华为、联发科等达成合作，可以被理解为隔空秀肌肉。

在文渊智库创始人王超看来，to B是变现难易程度决定的。不久前，一批大模型产品通过《生成式人工智能服务管理暂行办法》备案，正式向公众提供服务，百川大模型、文心一言等位列其中。

谈到开放后会否to C收费，文心一言相关人士告诉北京商报记者，“目前不会的”。“如果直接面向用户，很难有人为大模型买单。”王超向北京商报记者表示，“做大模型的创业公司没有接触用户的渠道，也没有负担大量免费用户的能力，to B会相对容易些。以B端客户为主要服务对象，是所有创业公司大模型的出路”。

按照王小川构想的B端大模型商业模式愿景，“B端带有天然真实场景，有中间层做企业服务，也有做大模型的公司”。

北京商报记者魏蔚

举报/反馈

北京商报

795万获赞 72.7万粉丝

以经济视角审视社会万象

北京经联互动科技有限责任公司官方账号

关注