安大互联
财经热点 > 财经资讯 > 斯坦福AI团队抄袭国产大模型?连做错样例都-一模一样-
【Llama】斯坦福AI团队抄袭国产大模型?连做错样例都-一模一样-
浏览次数:【665】  发布日期:2024-6-4 19:02:13    文章分类:财经资讯   
专题:Llama】 【MiniCPM】 【一模一样
 

  近期,斯坦福大学AI团队疑似剽窃中国大模型创业公司的消息引发AI圈内高度关注。事情的起因是,一个来自斯坦福的AI团队宣布,只需500美元就可训练出一个超越GPT-4V的SOTA多模态大模型。随后,在一个源代码开放平台上,有用户疑问该AI团队的项目疑似窃取国内大模型草创企业面壁智能刚于5月21日推出的开源端侧多模态模型。

  在路人的疑惑下,斯坦福AI团队删除疑问帖并隐藏了Llama3-V项目页面。得知此事后,面壁智能总裁李大海发文回应开源模型被斯坦福大学AI团队剽窃一事,称“Llama3V展现出和小钢炮(面壁智能大模型)同样的‘清华简’识别能力,连做错的样例都完全一样,而这一训练数据尚未对外公开。”李大海还感慨称,这也是一种受到国际团队认可的形式,但还是呼吁大家共建开放、合作、有信任的社区环境。

  抄得“连做错样例都完全一样”

  5月29日,一个来自斯坦福的AI团队开始在互联网上宣传500美元就能训练出一个SOTA多模态模型,该模型名为Llama3-V,作者声称Llama3-V比GPT-4V、Gemini Ultra、Claude Opus性能更强。公开资料显示,团队内有两位成员为斯坦福大学本科生,曾发表多篇机器学习领域论文,实习经历包含亚马逊云平台AWS和 特斯拉 SpaceX等。

  如此亮眼的实习经历加上斯坦福大学的背书,很快引起了网友的围观。不料,有技术圈人士发起了疑问。该人士称,名为Llama3-V的模型有大量作品疑似从MiniCPM-Llama3-V 2.5项目中窃取而来,后者为国内大模型草创企业面壁智能推出的开源端侧多模态模型,于2024年5月21日刚发布。

  在路人的疑惑下,斯坦福AI团队删除疑问帖并隐藏了Llama3-V项目页面。这造成了该疑问人士的愤慨,进一步举证证明剽窃。南都记者梳理发现,疑问人士认为,Llama3-V具有与面壁智能开源大模型完全相同的模型结构和配置文件,仅在变量名称上有所不同;其次Llama3-V作者害怕面对疑问,删除了疑问评论,还隐藏了与Llama3-V相关的项目页面。

  随后,面壁智能员工亲自下场,将面壁智能模型MiniCPM-Llama3-V 2.5的识别“清华简”功能与Llama3-V类似功能相对照。据了解,“清华简”是一种罕见写在竹子上的战国时代文字,在研发实验该功能的进程中,面壁智能团队重新近出土的文物中扫描了这些图片,并在大模型中进行原始注释。不料当该员工用Llama3-V识别“清华简”时,Llama3-V给出了近似的识别反应。 图片

  面对此次剽窃事件,面壁智能总裁李大海发文表示,来自斯坦福团队的Llama3V项目与面壁小钢炮最新发布的多模态模型MiniCPM-Llama3-V 2.5展现出惊人的相似度。

  “经过团队核对,除了社区网友列出的证据外,我们还发现Llama3V展现出和小钢炮同样的清华简识别能力,连做错的样例都完全一样,而这一训练数据尚未对外公开。这项工作是团队同学耗时数个月,从卷帙浩繁的清华简中一个字一个字扫描下来,并逐一进行数据标注,融合进模型中的。更加tricky的是,两个模型在高斯扰动验证后,在正确和错误表现方面都高度相似。我们对这件事深表遗憾,一方面感慨这也是一种受到国际团队认可的形式,另一方面也呼吁大家共建开放、合作、有信任的社区环境。一起加油合作,让世界因AGI的到来变得更好!” 图片

  面壁智能核心团队来自清华NLP实验室、知乎

  此次被牵涉进剽窃风波中的面壁智能建立于2022年8月,团队的核心成员来自清华大学自然语言处理与社会人文计算实验室 (THUNLP)——该实验室也撑起了去年大模型创业浪潮以来的“半壁江山”,跑出了生数科技、深言科技等 人工智能 企业和华为的“盘古大模型”。

  今年4月,南都记者从面壁智能方面获悉,该公司已完成了新一轮数亿元融资,该轮次融资由春华 创投 、华为哈勃领投, 北京市 人工智能 产业投资基金等跟投,而知乎作为战略股东持续跟投支持。据了解,该轮融资将用于人才引入、大模型底层算力与数据基础的建构和推动大模型高效训练和应用落地。

  在放眼望去清一色的清华系实验室开创团队中,面壁智能的总裁李大海是其中最特殊的存在,这不仅因为他兼任着知乎的CTO(首席技术官),也因为他在去年的大模型浪潮中一番探索后,选择了面壁智能来开启他人生中的第四次创业,这也是他第壹次担任创业团队的一号位。

  在加入知乎前,2006年大学结业后,李大海还有加入Google成为Google中国开创员工之一,与当时担任Google北京工程副院长刘俊一起做出了国内第壹个社会化搜索引擎“云云网”,和加入豌豆荚负责搜索业务等亮眼创业经历。

  2023年,随着ChatGPT浪潮席卷科技圈,当时担任知乎CTO的李大海在深入调研后知乎决定与面壁智能合作。4月,知乎宣布对面壁智能进行了数千万人民币的天使轮投资,同为清华系的头部大模型公司智谱参与跟投。后续,面壁智能逐渐发布了共研的知乎大模型“知海图AI”、基于大模型的对话产品“面壁Luca”等。此前,面壁智能的基座模型产品“面壁露卡Luca”已获备案审批并对外开放。

  而在一年后的这一次融资中,除了知乎作为战略股东持续跟投支持以外,投资者中还多了春华 创投 、华为哈勃,和 北京市 人工智能 产业投资基金。其中 北京市 人工智能 产业投资基金刚于今年年初投资了智谱AI。

  据媒体透露,面壁智能联合开创人刘知远对此事评论称, 人工智能 的飞速发展离不开全球算法、数据与模型的开源共享,让人们始终可以站在SOTA的肩上持续前进。但开源共享的基石是对开源协议的遵守,对其它贡献者的信任,对前人成果的尊重和致敬,Llama3-V团队无疑严重破坏了这一点。

  刘知远还提到,国内大模型团队如智谱-清华GLM、阿里Qwen、DeepSeek和面壁-清华OpenBMB正在通过持续的开源共享,在国际上受到了广泛的关注和认可。

手机扫码浏览该文章
 ● 相关资讯推荐
 ● 相关资讯专题
  • 网络建设业务咨询

   TEl:13626712526