【Llama】斯坦福AI团队承认抄袭国产大模型 - 热财经

栏目导航

财经热点 > 财经资讯 > 斯坦福AI团队承认抄袭国产大模型 - 热财经

【Llama】斯坦福AI团队承认抄袭国产大模型 - 热财经

浏览次数：【32】发布日期:2024-6-5 12:21:17 文章分类：财经资讯

专题：【Llama】【MiniCPM】

　　最近，斯坦福大学的一支AI研究团队陷入剽窃风波，其发布的多模态大模型Llama3-V被指控剽窃了清华系大模型创业公司面壁智能的MiniCPM-Llama3-V 2.5模型。目前，斯坦福团队认可了剽窃行为，并向原创团队道歉，同时删除了相关项目和社交媒体上的宣传内容。

　　据了解，该事件起源于5月29日，斯坦福AI团队在社交媒体和开源平台上高调发布了Llama3-V模型，声称仅以500美元的成本就训练出了一个性能可媲美GPT-4V的多模态大模型。该团队由斯坦福大学计算机科学精湛的学生Siddharth Sharma和Aksh Garg，和南加州大学的Mustafa Aljadery组成。由于团队成员的背景及模型的低成本高效率等亮点，该项目迅速吸引了业界的广泛关注。

　　然而，很快就有细心的网友发现，Llama3-V模型与面壁智能先前发布的MiniCPM-Llama3-V 2.5模型在架构、代码和配置文件等方面存在惊人的相似性。更令人震惊的是，Llama3-V甚至继承了MiniCPM-Llama3-V 2.5的一项独特功能——识别“清华简”战国古文字的能力，这一功能是基于面壁智能团队耗时数月、从卷帙浩繁的清华简中逐字扫描并逐一标注数据的非公开训练数据而开发的。

　　面壁智能团队证实，斯坦福大模型项目Llama3-V与MiniCPM一样，可以识别出“清华简”战国古文字，“不仅对得完全一样，连错得都完全一样”。

　　6月3日，斯坦福AI团队成员Aksh Garg在社交平台上发文回应了疑问，承认团队在项目的原创性验证上失职，并向原作者道歉。随后，Llama3-V的所有相关内容被从GitHub和HuggingFace等平台上删除。

　　值得注意的是，斯坦福 AI 实验室主任 Christopher David Manning 在社交平台发帖谴责了剽窃行为，同时还对清华的开源模型表达了赞赏。