商业热点 > 商业洞察 > 爱奇艺起诉-AI六小虎-MiniMax,业内 - AI训练素材版权多处灰色地带

【爱奇艺】爱奇艺起诉-AI六小虎-MiniMax,业内 - AI训练素材版权多处灰色地带

查看信息来源】   发布日期:1-9 10:21:11    文章分类:商业洞察   
专题:爱奇艺】 【AI大模型


K图 IQ_0

  红星资本局1月9日消息,最近,视频平台爱奇艺与“大模型六小虎”之一稀宇科技(MiniMax)之间的一起著作权纠纷,引发市场关注。有消息称,爱奇艺起诉稀宇科技旗下海螺AI,称其未经授权使用了爱奇艺享有版权的素材进行模型训练。这是国内首起“视频平台针对AI视频大模型侵权”的诉讼。

  爱奇艺方面向红星资本局确认了上述事件,称该案正在司法程序中,没有更多信息可以透露。截至发稿,稀宇科技方面暂未回复。

  有网友评价到,“爱奇艺打响了视频平台诉大模型侵权的第壹枪。”AI大模型飞速发展背后,有关模型训练素材版权的界限不断引发讨论。一位AI领域业内人士向红星资本局表示,现在模型训练素材和数据的版权很多处于灰色地带,商用层面经常会涉及到版权问题。

  德恒重庆律师事务所顶级顾问赵长江分析称,与传统侵权行为相比 ,AI大模型侵权认定仍有很多难点。侵权主体多元复杂、主观过错认定困难 、因果关系举证艰难 、侵权行为隐蔽性强和权利界限模糊都是难点。上海财经大学法学院教授叶名怡也告诉红星资本局,AI训练到底使用了哪些素材、训练了多久,在调查取证方面都有一定难度。

视频平台诉大模型侵权打响“第壹枪”

  关于这起著作权纠纷,红星资本局了解到,爱奇艺已向上海徐汇区人民法院提起诉讼,目前正在司法程序中。主要争议点在于稀宇科技旗下的海螺AI未经授权使用了爱奇艺享有版权的素材进行模型训练。

  稀宇科技与百川智能、月之暗面、零一万物、阶跃星辰、智谱AI被并称为“大模型六小虎”,在大模型领域有一定知名度。

  公开资料显示,建立于2021年12月的稀宇科技,专注于研发多模态、万亿参数的MoE 文本大模型、语音&音乐大模型、图像大模型和视频大模型,并基于此推出了多个原生应用,上述提到的海螺AI就是其中之一。稀宇科技开创人名为闫俊杰,曾在商汤科技担任副总裁等职务。

  红星资本局注意到,海螺AI的核心功能包含智能视频生成,用户可以通过上传图片和文字进行视频生成,支持多种风格和效果。去年8月,稀宇科技发布了视频生成模型Video-01,支持生成720p分辨率、25fps的高清视频。

  1月8日,红星资本局尝试了海螺AI的文生视频功能,输入文字“生成一段飞机悬窗外的风景,有云层,有城市夜景”,大约2分钟后,海螺AI生成了一段时长6秒的视频,其中的内容与文字描述一致,但云层与城市夜景视觉高度不同不明显,看上去就像城市位于云层中。 image.png

图片由海螺AI生成

  尽管爱奇艺未对外公布享有版权的素材是啥,但市场猜想,或与爱奇艺平台内的视频内容有关。

  红星资本局又尝试在海螺AI中生成一段电视剧《我的阿勒泰》中主角巴太骑马的视频,《我的阿勒泰》为爱奇艺自制剧,在腾讯视频等其它平台中均无法播放。数分钟后,海螺AI生成了一段6秒长的骑马视频,背景为雪山草原,但骑马的人其实不是电视剧中的主角巴太。 image.png

图片由海螺AI生成

律师解读:AI大模型侵权认定仍有很多难点

  在AI大模型飞速发展的进程中,有关创作权归属、作品独创性和版权保护问题,不断引发讨论,国内外已经有多起相关纠纷。如2024年1月,中国首例AI生成图片著作权侵权案判决落地。

  但红星资本局注意到,针对AI训练素材数据版权的问题,目前还没有相关司法判定。

  一位AI领域业内人士陈先生(化名)向红星资本局表示,对于AI大模型而言,训练素材和数据是极为重要的资源,没有素材和数据就做不出来。关于版权问题,目前只有科研层面暂不涉及,但商用层面经常会涉及。

  陈先生也提到,现在模型训练素材和数据的版权很多处于灰色地带,如果有模型用了别人的版权数据训练,版权方也会陷入举证难的情景。

  德恒重庆律师事务所顶级顾问赵长江也持有相同观点。他告诉红星资本局, 人工智能 生成内容的发生需要经历数据收集、数据投喂、机器学习、内容输出四个阶段,然而前三个阶段通常处于“黑箱”阶段,除非落实信息披露制度,不然权利人很难知道是否使用了其作品。

  另外,与传统侵权行为相比 ,AI大模型侵权认定仍有很多难点。赵长江律师向红星资本局分析称,侵权主体多元复杂、主观过错认定困难 、因果关系举证艰难 、侵权行为隐蔽性强和权利界限模糊都是难点。

  他举例到:“就侵权主体多元复杂而言,传统侵权行为主体通常较为明确,而AI大模型侵权涉及模型开发者、部署者、专业用户、个体用户等多个主体,各方在数据收集、模型训练、应用开发、内容生成及流传等环节都可能存在侵权风险,且责任难以简单划分。”

  上海财经大学法学院教授叶名怡也告诉红星资本局,AI大模型训练素材侵犯著作权具有相应的非公开性,当海量的素材喂给AI,其实不是直接面向公众的。AI训练到底使用了哪些素材、训练了多久,在调查取证方面都有一定难度。

AI大模型如何防范侵权风险?

  红星资本局注意到,海螺AI通过用户上传的图片和文字进行视频生成,其用户协议中也注明了相应的免责条款。

  如“上传的内容需要由用户原创或已获合法授权,同时不侵犯任何人的 知识产权 ”。

  另外,海螺AI也预知到了著作权侵权的危险,其用户协议注明:“为保护文学、艺术和科学作品作者的作品权,和与著作权相关的权益,我们高度重视 知识产权 ,并尽量避免侵犯他人合法权益。可是作为问答基础服务的提供者,我们每天会收到大量的用户上传的内容并进行改善我们的算法。”并表示,会在收到侵权内容凭据后,第壹时间安排处理,采取删除、封禁侵权账号等措施。

  叶名怡教授分析称,一般网站基本都会有类似的用户协议,但其实不意味着能因此免责。并且如果AI大模型平台是因为商用目的而私自使用版权素材,会在一定水平上构成侵权。

  赵长江律师分析称,探讨AI大模型训练数据的作品权问题前,有必要对其使用作品的流程进行技术画像,看在哪个环节,可能发生著作权问题。 目前司法实践中较少单独直接起诉输入端的数据投喂构成著作权侵权的,多数是起诉输出端生成物侵犯复制权、改编权、汇编权、流传权等,请求法院判令侵权者删除训练数据以停止输出端的作品权侵权。

  “这实质上包含两方面问题:一是输入端的数据投喂本身是否构成著作权侵权;二是删除输入端已经投喂的练习数据是否为制止输出端生成物侵权所务必的措施。这两方面问题均牵涉广泛,对输入端的数据投喂本身是否构成著作权侵权,目前争议也较大。”赵长江补充到。

  赵长江也提醒到,企业在AI大模型开发和训练进程中,要做到有效预防版权侵权风险 ,需确保数据收集合法,合理使用数据 ,和通顺投诉、举报渠道,优化技术措施等。尽可能减少在发展早期可能面临的侵权纠纷,防止陷入大量侵权纠纷的泥沼,影响公司持续稳健经营。

  红星新闻记者强亚铣

手机扫码浏览该文章
 ● 相关商业动态
 ● 相关商业热点
爱奇艺】  【南方都市报】  【《漂白》】  【TikTok】  【OpenAI】  【Stargate】  【原作者】  【各执一词】  【AI大模型】  【知识产权】  【Shutterstock】  【MiniMax】