北京日报客户端 | 记者 孙奇茹
11月6日,记者从蚂蚁集团获悉,根据国家七部委联合公布的《生成式人工智能服务管理暂行办法》指导要求,蚂蚁百灵大模型已完成备案,基于百灵大模型的多款产品已陆续完成内测,将向公众开放。11月4日,360公司的大模型“奇元大模型”也通过备案落地。今年9月,“360智脑大模型”已获批面向公众开放,此次获批后360成为国内首家两个大模型均通过备案的科技企业。
相关负责人介绍,本次通过备案的是蚂蚁百灵语言大模型,该大模型采用Transfromer架构,基于万亿级Token(token是语言模型中用来表示单词或短语的符号)语料训练而成,支持窗口长度达32K,推理能力领先,在主流推理类榜单中排名前列,在算力、安全力和知识力上表现突出。
算力上,蚂蚁建设了万卡异构集群,其中硬件算力效率(HFU)超过60%,集群有效训练时长占比90%以上,RLHF(基于人类反馈的强化学习)训练在同等模型效果下训练吞吐性能相较于业界方案提升3.59倍,推理性能相较于业界方案提升约2倍,处于业界先进水平。安全能力方面,研发了大模型安全一体化解决方案——“蚁天鉴”。“蚁鉴”平台作为业内首个大模型安全评测工具,支持50万/天饱和式攻击,全面覆盖生成内容数百类风险;“天鉴”平台可在大模型运行时,覆盖8大类风险,采用大模型对抗大模型的方式,使得风险召回率大于99%,其Guardrails前置护栏功能,能精确召回20多类提问风险意图。
据悉,在基础大模型层面,除了本次通过备案的百灵语言大模型,蚂蚁集团也在研发百灵多模态大模型,并已内测。
360方面,从大模型定位和应用角度来看,此次通过备案的奇元大模型具备充足的灵活性和可扩展性,商业化方向和产品定位以B(企业级)端用户为主,后期将会聚焦更多的商业化应用和垂直领域,帮助企业、机构提升工作效率。
此前,360智脑大模型已于今年9月首批获得备案开放,上线首周获得了300万用户超5000万余次互动,该大模型集成了360GPT大模型、360多模态大模型技术能力,具备生成创作、多轮对话、逻辑推理等十大核心能力、数百项细分功能,覆盖大模型全部应用场景。
举报/反馈

北京日报客户端

7779万获赞 548.6万粉丝
爱北京、关注北京、读北京
北京日报报业集团
关注
0
0
收藏
分享