来源:猎云网。

大模型领域,出现罕见一幕!

近日,斯坦福某AI团队(下称:斯坦福团队)被曝抄袭面壁智能开源成果,有“套壳”嫌疑:模型结构和代码“展现出惊人的相似度”。

针对此事,知乎CTO、面壁智能CEO李大海表示:我们对这件事深表遗憾!一方面感慨这也是一种受到国际团队认可的方式,另一方面也呼吁大家共建开放、合作、有信任的社区环境。

对于“抄袭”行为本身,面壁智能方面也给出了补充介绍。

李大海介绍到,“经过团队核实,除了社区网友列出的证据外,我们还发现 Llama3V展现出和小钢炮一样的清华简识别能力,连做错的样例都一模一样,而这一训练数据尚未对外公开。这项工作是团队同学耗时数个月,从卷帙浩繁的清华简中一个字一个字扫描下来,并逐一进行数据标注,融合进模型中的。更加tricky的是,两个模型在高斯扰动验证后,在正确和错误表现方面都高度相似。”

事件始于5月29日,斯坦福团队发布Llama3V项目,并宣称500美元即可训练出一个多模态大模型,效果比肩GPT-4V、Gemini Ultra、Claude Opus等。

凭借着低廉的价格、优秀的团队背景,上述模型发布的推文在X平台(推特)获得了较大关注。

大量关注下,随即被眼尖的网友发现,Llama3V项目与面壁智能最新发布的多模态模型MiniCPM-Llama3-V 2.5“雷同”。

面对越来越多的抄袭“质疑”,斯坦福团队也从最初的“狡辩”,变成了“删库跑路”。至此,“抄袭”风波渐息。

经历此事,李大海不无感慨,“
技术创新不易,每一项工作都是团队夜以继日的奋斗结果,也是以有限算力对全世界技术进步与创新发展作出的真诚奉献。我们希望团队的好工作被更多人关注与认可,但不是以这种方式。”

举报/反馈

猎云网

529万获赞 9.7万粉丝
聚焦科技创业创新,用心服务创业者。
鲲鹏计划获奖作者,北京猎云万罗科技有限公司官方账号,优质科技领域创作者
关注
0
0
收藏
分享