羊城晚报全媒体记者 沈钊
5月中下旬以来,国内的大模型价格突如其来地“跳水”。5月15日,字节发布豆包大模型并宣布主力模型较行业平均价格便宜99.3%。5月21日,阿里云抛出重磅“炸弹”,宣布通义千问GPT-4级主力模型Qwen-LongAPI输入价格直降97%。在这之后,百度、科大讯飞、腾讯纷纷宣布旗下部分产品“免费”。这次大模型价格集体“跳水”之后,似乎意味着AI进入了普惠时代。
价格大战汇聚五大巨头
记者了解到,在降价前,国内的部分主流大模型服务API输入价格可能达到千字0.02元的水平。这个价格对于需要频繁调用大模型API的用户来说,价格并不实惠。
而在今年5月初,大模型的降价潮就已经初现端倪。5月6日,幻方量化旗下DeepSeek(深度求索)发布第二代MoE(专家模型)DeepSeek-V2,API(接口)定价每百万tokens(文本处理过程中的最小单位)输入1元、输出2元(32K上下文),价格为GPT-4-Turbo的近百分之一。
5月13日,智谱大模型开放平台上线新的价格体系,入门级产品 GLM-3 Turbo 模型调用价格下调80%,为1元/百万tokens。随后,OpenAI推出GPT-4o,价格为GPT-4 Turbo的一半,输入、输出每百万 tokens收费5美元、15美元。
在这之后,字节跳动开始“掀桌子”。5月15日,字节跳动正式发布豆包大模型,并披露豆包主力模型在企业市场的定价为0.0008元/千tokens,较行业平均价格便宜99.3%。
紧跟其后的是阿里云,5月21日,阿里云抛出重磅炸弹:通义千问GPT-4级主力模型Qwen-Long,API输入价格从0.02元/千tokens降至0.0005元/千tokens,直降97%。这意味着,1元可以买200万tokens,相当于5本《新华字典》的文字量。这款模型最高支持1千万tokens长文本输入,降价后约为GPT-4价格的1/400。
也是在同一天,百度智能云宣布,百度文心大模型的两款主力模型ENIRE Speed、ENIRE Lite全面免费,即刻生效。这两款大模型发布于今年3月,支持8K和128K上下文长度。按照以往的定价,ERNIE Lite输入0.003元/千tokens,输出0.006元/千tokens。ERNIE Speed价格为输入0.004元/千tokens,输出0.008元/千tokens。
在这之后,腾讯云公布全新大模型升级方案。其主力模型之一混元-lite模型,API输入输出总长度计划从目前的4k升级到256k,价格从0.008元/千tokens调整为全面免费;除了腾讯,科大讯飞今天也宣布对大模型价格进行调整,将讯飞星火Lite API永久免费开放,讯飞星火Pro/Max API价格也低至0.21元/万tokens。
降价有望加速AI应用爆发
大模型降价究竟意味着什么?
实际上,国内的中小企业更多的是通过API接口调用大模型的算力。头部厂商宣布大模型降价,有点类似于网络运营商将流量费用降低,有利于下游企业对大模型应用的深入开发,这样一来就能够尽量避免企业在大模型底层硬件、软件层面的重复建设,推动整个行业向下游应用端发力。
华龙证券研报表示,随着国内外大模型厂商技术角逐进一步激烈,大模型行业开启价格战信号明显。通过降低价格门槛,大模型厂商有望吸引更广泛的企业用户群体,从而进一步平衡收入和成本。同时,更多C端用户有望免费使用基础AI应用,庞大的访问量有助于企业进一步提升模型服务能力,完成良性循环。
阿里云智能集团公共云事业部总裁刘伟光此前公开表示:“AI推理的成本只有以每年十倍甚至百倍下降,才能推动各行各业AI应用的爆发,阿里云这次大幅降低大模型推理价格,就是希望加速AI应用的爆发。我们预计未来大模型API的调用量会有成千上万倍增长。”
值得一提的是,刘伟光在提起大模型降价的行业趋势时表示,“价格战”要遵循市场的基本原则,降价一定要普惠市场,以推动市场发展为目标,“不以流量博噱头”。
至于什么样的企业可以用降价普惠市场、推动市场发展,刘伟光提到了四个原则:首先,基础模型能力要足够领先;其次,模型要有真正的推理资源;第三,模型要有很多客户在使用,能够产生商业价值;最后,大模型要是这家企业主要的业务,且企业要有足够的战略定力。
行业仍期待超级应用
“价格战的背后,也体现出国产大模型产品的大同小异,差距不大只能拼价格的特点。”工信部信息通信经济专家委员会委员盘和林点出了当前国产大模型的处境:短期无法超越国外大模型,内部之间也拉不开差距。
猎豹移动董事长兼CEO傅盛认为,大模型降价的目标不是为了用户直接使用,而是为了吸引开发者。短期来看,大模型的性能遇到了瓶颈。“谁也甩不开谁,谁也拿不出撒手锏,降低推理成本、降低售价成了现在每一家的高优先级任务”。
实际上,除了价格以外,客户更关心的还是大模型能够在业务中带来哪些实质性的价值,以及AI技术所展现的生产力,是否能够助力企业在运营过程中削减成本、提升效率及增进实际业务效益?这同时也是大模型在商业化应用过程中必须要面对和解答的关键问题。就目前来看,不论是国内市场还是国际市场,关于大模型如何落地并产生具体价值的事例,仍然有待进一步补充和完善。
百川智能创始人王小川表示,价格免费是优势,但不一定是竞争力。“百川并不会掺和到价格战当中,因为To B不是公司的主要商业模式,价格战的影响也有限。公司会将更多的精力放在超级应用当中。”
蚂蚁集团副总裁、金融大模型负责人王晓航此前接受采访时也表示,对于下一步的增长空间,他认为大模型要融入千行百业,让产业从AI化中收获价值,才能成为广泛的刚需。他预计,未来一年,一定会出现现象级的生成式AI应用。“每个行业都在等待自己的AI超级应用,谁在产业里更有数字化基础,谁把行业和技术结合得更紧密,谁就能够带来这样的产品。”