安大互联
财经热点 > 财经资讯 > 错例都一样!斯坦福学生团队致歉抄袭中国大模型 - 已撤回,代码作者失联
【Llama】错例都一样!斯坦福学生团队致歉抄袭中国大模型 - 已撤回,代码作者失联
浏览次数:【750】  发布日期:2024-6-4 21:46:20    文章分类:财经资讯   
专题:Llama】 【MiniCPM
 

  美国斯坦福大学的一个AI( 人工智能 )团队就剽窃中国大模型致歉。

  最近,由三位美国斯坦福大学学生组成的一个AI团队发布了开源模型Llama3-V。可是,该模型很快被曝出与中国大模型公司面壁智能的开源成果MiniCPM-Llama3-V 2.5拥有几乎完全相同的模型架构与代码,引发“剽窃”疑问。

  当地时间6月3日,Llama3-V团队的两位作者森德哈斯·沙玛(Siddharth Sharma)和阿克沙·加格(Aksh Garg)在社交平台X上发布文章,向MiniCPM团队正式道歉,表示会将Llama3-V模型从网络上撤下。

  在道歉信中,沙玛和加格称他们负责模型的宣发工作,该模型代码的作者是穆斯塔法·阿尔贾德里(Mustafa Aljadery),但两人在看到相关疑问后于6月2日询问了阿尔贾德里,尔后再也没能联系上后者,于是决定发布道歉声明。

  目前,阿尔贾德里的X账号显示“仅好友可见”,Llama3-V模型也已经从Hugging Face等开源平台上下架。不过,加格还在发布Llama3-V的Medium页面上保存了一点描述和介绍,在开头附上了道歉声明。

  道歉声明。来源:X平台

  公开资料显示,北京面壁智能科技有限责任公司建立于2022年8月,核心产品包含全流程大模型高效加速平台ModelForce和CPM大模型。今年4月,面壁智能完成新一轮数亿元融资,由华为哈勃领投,春华 创投北京市 人工智能 产业投资基金等跟投,知乎作为战略股东持续跟投支持。

  在该团队道歉前,面壁智能的联合开创人兼总裁李大海已在朋友圈发文回应,披露了Llama3-V能够与MiniCPM一样识别出“清华简”战国古文字的新证据,而由MiniCPM团队扫描并人工批注的该古文字数据并未对外公开,证实了Llama3-V模型涉嫌剽窃。

  李大海表示,团队对这件事深表遗憾:“我们希望团队的好工作被更多人关注与认可,但不是以这种方式……一方面感慨这也是一种受到国际团队认可的形式,另一方面呼吁大家共建开放、合作、有信任的社区环境。”

  面壁智能总裁李大海的朋友圈回应

  这场风波起源于5月29日。当日,斯坦福大学的一个研究团队在开源社区中发布了名为“Llama3-V”的模型,称只要500美元(约合人民币3622元)就能训练出一个SOTA多模态模型,且效果比肩知名大模型GPT-4V、Gemini Ultra与Claude Opus。

  由于该团队的三位作者都来自斯坦福大学,又拥有在 特斯拉 、SpaceX和亚马逊等科技大厂的相关经历,发布该模型的X文章很快获得超过30万的浏览量,该模型也迅速在Hugging Face首页的模型热度名单上冲进前排。

  然而,不久后,开源社区内开始出现怀疑声,疑问Llama3-V是在“套壳”面壁智能于今年5月中旬刚刚发布的最新8B多模态小模型MiniCPM-Llama3-V 2.5,且没有在项目中提到任何关于后者的信息。

  对此,Llama3-V团队回应称其“只是使用了MiniCPM-Llama3-V 2.5的tokenizer(分词器)”,并称团队在MiniCPM-Llama3-V 2.5发布前就已经启动了这项工作。

  6月2日,网友pzc163在MiniCPM-V的Github页面上对此事进行了还原,并列举出大量的代码证据。该网友称自己在Llama3-V的Github发布页面下提出了疑问,但Llama3-V团队迅速删帖并对Llama3-V模型进行隐藏处理,所以来提醒MiniCPM-V团队关注此事。

  疑问Llama3-V项目的帖子。来源:Github

  证据显示,Llama3-V项目使用了与MiniCPM-Llama3-V 2.5项目基本完全相同的模型结构和代码实现。另外,Hugging Face 发布页面上的历史记录显示,Llama3-V的作者曾在该页面上直接导入了MiniCPM-V的代码,然后改名为Llama3-V。

  在该帖的回应中,网友们纷纷建议向斯坦福大学举报此事。有评论指出,虽然套用开源模型且没有致谢的做法可能只是造成了一点侵权,但由于Llama3-V的团队在互联网上对该模型进行了大力宣传,或将在开源领域造成广泛的不良影响。

  值得强调的是,在Llama3-V团队道歉前,斯坦福 人工智能 实验室主任克里斯托弗·大卫·曼宁(Christopher David Manning)也在X平台上发文谴责这一剽窃行为,并称MiniCPM“是很好的开源作品”。

  对于此事,面壁智能首席科学家、清华大学长聘副教授刘知远也在知乎上发表了回应,称这次事件让他感慨“过去十几年科研经历的斗转星移”:“从横向来看,我们显然仍与国际顶尖工作如Sora和GPT-4o有明显差距;同时,从纵向来看,我们已经从十几年的nobody,快速成长为 人工智能 科技创新的关键推动者。面向即将到来的AGI时代,我们应该更加自信积极地投身其中。”

手机扫码浏览该文章
 ● 相关资讯推荐
2024-9-19【人工智能】中国式体检20年 - 从例行公事到真的救命
2024-9-17【数据中心】铜价长期将飙升?必和必拓 - AI浪潮将加剧铜短缺
2024-9-14【新能源】携手清华解决可持续挑战 - 远景的又一次零碳试验
2024-9-15【人工智能】服贸会观察 - 大模型遇数据瓶颈、算力不足,电信运营商如何应对
2024-9-14【大模型】智谱AI狂奔!视频通话功能-首秀-,国产大模型解锁新能力 - 聚焦服贸会
2024-9-14【人工智能】人工智能板块,迎利好!
2024-9-14【人工智能】国家网信办 - 任何组织和个人不得恶意删除、篡改、伪造、隐匿人工智能生成合成内容标识
2024-9-14【人工智能】人工智能催收走热 - 面临双重合规挑战
2024-9-13【2024】如此执着做空!兴登堡再度发文狙击印度阿达尼集团
2024-9-13【大数据】合合信息 - AI与大数据技术驱动 赋能各行各业实现数字化与智能化转型
 ● 相关资讯专题
人工智能】  【张黎刚】  【例行公事】  【数据中心】  【云计算】  【必和必拓】  【新能源】  【可持续】  【中国移动】  【中国电信】  【电信运营商】  【大模型】  【李飞飞】  【利雅得】  【互联网金融】  【2024】  【offer】  【尼集团】  【大数据】  【合合信息】  【核心技术】  【智能化】  【数字化】 
  • 网络建设业务咨询

   TEl:13626712526