近日,美国斯坦福大学AI团队主导的 Llama3-V 开源模型被证实套壳抄袭国内清华与面壁智能的开源模型“小钢炮”MiniCPM-Llama3-V 2.5,该团队的两位作者Siddharth Sharma和 Aksh Garg在社交平台上就这一学术不端行为向面壁MiniCPM团队正式道歉,并撤下模型。
作者之一的Aksh Garg表示,“我、Siddharth Sharma,以及Mustafa一起发布了Llama3-V,Mustafa为这个项目编写了代码,但从昨天起就无法联系他。”
Aksh Garg说:“我们向作者道歉,并对自己没有努力验证这项工作的原创性感到失望。我们对所发生的事情承担全部责任,并已撤下Llama3-V,再次致歉。”
另外,斯坦福人工智能实验室主任Christopher David Manning也发文谴责这一抄袭行为,并对MiniCPM这一中国开源模型表示赞扬。事件起源于5月29日,一个斯坦福AI 团队在网络上宣传只需500美元就可训练出一个超越GPT-4V的SOTA多模态大模型。随后,网友发现,该团队的Llama3-V模型使用的模型结构和代码与面壁智能不久前发布的MiniCPM-Llama3-V2.5极为相似,仅修改了部分变量名。6月2日深夜,面壁智能团队证实,斯坦福大模型项目Llama3-V与MiniCPM一样,可以识别出“清华简”战国古文字,“不仅对得一模一样、连错得都一模一样”。这一古文字数据为研究团队花费数月从清华简上逐字扫描并人工标注得来,并未对外公开,证实抄袭事实。