作为后来者,百川智能以产品快速迭代的形式换时间。9月6日,百川智能发布了baichuan-7B 和baichuan-13B大模型的升级版。以百川智能CEO的身份入局大模型赛道之后,王小川差不多一个月发布一款大模型产品,既有开源的也有闭源的。如同iOS与安卓一样,未来大模型生态大概率会开源闭源并存,百川智能也没有拘泥于一种技术处置方式。但在客户选择上,百川智能更偏向B(企业)端。对于创业公司而言,这更像一种默契,绕过了场景尴尬,缩短了变现时间。
9月6日,百川智能正式开源微调后的Baichuan2-7B、Baichuan2-13B、Baichuan2-13B-Chat与其4bit量化版本,均为免费可商用。
Baichuan2-7B-Base 和 Baichuan2-13B-Base,均基于2.6万亿高质量多语言数据进行训练, Baichuan2-13B-Base相比上一代13B模型,数学能力提升49%,代码能力提升46%,安全能力提升37%,逻辑推理能力提升25%,语义理解能力提升15%。根据MMLU等多个英文评估基准评分 ,Baichuan2-7B以70亿的参数在英文主流任务上与130亿参数量的LLaMA2持平。
百川智能成立于2023年4月10日,6月中旬开始对外发布大模型产品,包括Baichuan-7B、Baichuan-13B两款开源免费可商用的中文大模型,以及一款搜索增强大模型Baichuan-53B,目前两款开源大模型下载量已超过500万次。
在现场,王小川展示了百川大模型在安全、代码、数字计算、推理和语义相关的能力,强调了开源对学术研究等方面的作用。
站在行业的角度,负责技术业务的APUS副总裁邓小波向北京商报记者解读了开源和闭源区别,“开源、闭源是对技术的处置方式,跟客户场景没有直接相关的联系”。
尽管当日的主题围绕着开源,但王小川并不纠结于开源闭源,他认为,“这不是竞争关系,而是不同产品间的互补关系”。对于服务对象,王小川也很明确,这些大模型不是定位为to C(用户)的沙盒型产品,本质上更多是to B服务。
不止王小川,越来越多的从业者都在强调自己在企业级市场的能力。前一天,把企业级的千帆大模型平台升级到2.0版本的百度智能云,就是最新的例子。在大模型发布现场,百川智能与腾讯云、阿里云、火山方舟、华为、联发科等达成合作,可以被理解为隔空秀肌肉。
在文渊智库创始人王超看来,to B是变现难易程度决定的。不久前,一批大模型产品通过《生成式人工智能服务管理暂行办法》备案,正式向公众提供服务,百川大模型、文心一言等位列其中。
谈到开放后会否to C收费,文心一言相关人士告诉北京商报记者,“目前不会的”。“如果直接面向用户,很难有人为大模型买单。”王超向北京商报记者表示,“做大模型的创业公司没有接触用户的渠道,也没有负担大量免费用户的能力,to B会相对容易些。以B端客户为主要服务对象,是所有创业公司大模型的出路”。
按照王小川构想的B端大模型商业模式愿景,“B端带有天然真实场景,有中间层做企业服务,也有做大模型的公司”。
北京商报记者 魏蔚