最近,斯坦福大学的一支AI研究团队陷入剽窃风波,其发布的多模态大模型Llama3-V被指控剽窃了清华系大模型创业公司面壁智能的MiniCPM-Llama3-V 2.5模型。目前,斯坦福团队认可了剽窃行为,并向原创团队道歉,同时删除了相关项目和社交媒体上的宣传内容。
据了解,该事件起源于5月29日,斯坦福AI团队在社交媒体和开源平台上高调发布了Llama3-V模型,声称仅以500美元的成本就训练出了一个性能可媲美GPT-4V的多模态大模型。该团队由斯坦福大学计算机科学精湛的学生Siddharth Sharma和Aksh Garg,和南加州大学的Mustafa Aljadery组成。由于团队成员的背景及模型的低成本高效率等亮点,该项目迅速吸引了业界的广泛关注。
然而,很快就有细心的网友发现,Llama3-V模型与面壁智能先前发布的MiniCPM-Llama3-V 2.5模型在架构、代码和配置文件等方面存在惊人的相似性。更令人震惊的是,Llama3-V甚至继承了MiniCPM-Llama3-V 2.5的一项独特功能——识别“清华简”战国古文字的能力,这一功能是基于面壁智能团队耗时数月、从卷帙浩繁的清华简中逐字扫描并逐一标注数据的非公开训练数据而开发的。
面壁智能团队证实,斯坦福大模型项目Llama3-V与MiniCPM一样,可以识别出“清华简”战国古文字,“不仅对得完全一样,连错得都完全一样”。
6月3日,斯坦福AI团队成员Aksh Garg在社交平台上发文回应了疑问,承认团队在项目的原创性验证上失职,并向原作者道歉。随后,Llama3-V的所有相关内容被从GitHub和HuggingFace等平台上删除。
值得注意的是,斯坦福 AI 实验室主任 Christopher David Manning 在社交平台发帖谴责了剽窃行为,同时还对清华的开源模型表达了赞赏。
面壁智能团队对此事件表示深表遗憾,并呼吁业界共建开放、合作、有信任的社区环境。面壁智能总裁李大海在朋友圈发声,表示对这件事深表遗憾:“技术创新不容易,每一项工作都是团队通宵达旦的奋斗结果”。“希望团队的好工作被更多人关注与认可,但不是以这种方式”。
此次事件不仅引发了关于学术诚信和 知识产权 保护的讨论,也袒露了AI行业在快速发展中面临的一些挑战。业内专家呼吁,应加强对AI研究成果的原创性保护,同时提高科研人员的学术道德意识,以维护整个行业的健康发展。