在经过生成式AI的“教育”之后,很多人开始感叹AI的炉火纯青。这时,行业内的人士却也发现,经过大模型训练而“涌现”的AI虽有惊艳之处,但落地到具体的应用场景,总有点“缺了啥”的感觉。
这对成都潜在 人工智能 科技有限公司(以下简称“行者AI”)来说其实不是一个陌生的问题。自从2016年成立团队以来,行者AI就在关注如何利用AI为游戏从业者实现降本增效。
“我们希望成为一个帮助游戏甚至文娱公司降本增效的平台,我们希望把工具做得更加简单易用,让大伙可以一键上手。”行者AI 总裁尹学渊说道。
行者AI 总裁尹学渊图片来源:左梦涵摄
采访当天,行者AI 总裁尹学渊身着带有行者AI标志的Polo衫,捯饬十分干练。技术身世的他语速极快,在回答问题时往往采用拆分成几个方面或条理的形式来回答。
这种问题导向的思维同样也贯穿在行者AI的产品当中,在他看来,如何落地“最后一公里”是燃眉之急,“大模型结合领域专家的垂直模型可能更有市场空间或应用场景。”
随着对产业链环节的逐步“拆解”,目前,行者AI已推出包含AI美术、AI音乐、AI虚拟玩家、AI安全等在内的产品及解决方案。
尹学渊告诉《每日经济新闻》记者(以下简称“NBD”),朝着这个方向,行者AI正在不断优化产品,以期能够让游戏行业甚至内容创作的从业者能够尽量节省生产的时间,以把更多精力放在创意本身,正如其愿景所言:聚焦于1%的创意,释放99%的密集型劳动。
缔造一整套生产力工具
NBD:在今年大模型的热潮下,很多观察都指向其“降本增效”的想象空间。无独有偶,行者AI的团队在2016年成立之初,想要处理的主要就是游戏开发中的“高成本、低成功概率”问题?
尹学渊:游戏本身来讲是一个非常复杂的系统工程,其中有各种各样的环节。所有环节累加在一起造成了一个问题,那就是游戏的开发成本特别高,可是另一方面,它的成功概率又低。其实,不只是游戏,整个内容行业的成功概率可能都是较低的。
高成本、低成功概率意味着想挣钱还是挺难的。因此我们当时立项,就是希望降低游戏开发制作和运营的成本,途径就是利用 人工智能 ,因为它本身是一个降本增效的工具。
打个比方,单独来看,可能每款产品只有3%的成功概率,可是如果用相同的钱,成本降低的情景下,可以去做10款。我们天马行空地想一想,如果能把成本降到1%,就可以做100款。换句话说,容错率在不断提高,游戏公司的产品也更容易“跑”出来。
NBD:2016年 人工智能 的“明星”当属AlphaGo,其采用的深度强化学习算法也走红一时。在当时的 人工智能 热潮和技术条件的环境下,行者AI主要推出了啥产品?相应解决了哪些“槽点”?结果是否又超出预期?
尹学渊:我们最早做的是虚拟玩家,也就是 机器人 陪玩,和AlphaGo类似,这种算法的底层逻辑是深度强化学习。推出之后,立竿见影地解决了玩家在匹配甚至用户留存方面的问题。
在竞技游戏当中, 机器人 陪玩是一个重要的话题。竞技游戏作为一种强对抗属性的游戏类型,玩家在双方实力十分的时候实际上就是最舒服的,棋逢对手才最好玩,一方太强或是太弱都会让玩家感受到没意思。在这种情景下,AI可以起到的作用是饰演对手或是队友,综合给到一种很好的体验效果——要么是“险胜”,要么是“惜败”。
深度强化学习的原理非常适合这个场景,它可以真正教会AI玩游戏,相比以前用行为树来控制 机器人 时的打法单一、可预测,基于深度学习的AI 机器人 可以达到媲美人类的水平,也有更多的施展空间。
另一方面我们也开始尝试AI美术,不过还是受限于当时的算法,对抗生成网络(GAN),和算力。我们发现,GAN能画的东西不多。直到近年流行开来的扩散(Diffusion)算法之后,AI美术的能力才得到了极大提升。
所以说,当时的结果并没有超出预期,虽说AlphaGo的推出给市场造成很多启发,但从设想到落地我们还是花了挺多的时间。
NBD:在上述提到的算法、算力迭代的大环境下,行者AI目前已经有AI虚拟玩家,AI2D、3D图像资发生产, AI音乐音效生产,AI内容安全的产品矩阵,缔造这样一个矩阵的考虑是啥?主要处理的又是游戏行业内的哪些具体问题?
尹学渊:近5年以来,整个行业提了很多类似“游戏工业化”的概念。啥叫工业化?这是一个相对的概念,打个比方,以前可能更像手工劳作。而建立一个标准化的工业流程,像福特生产汽车一样来生产游戏,它的成本才能降低,成功概率才能提升。
既然是工业化,就需要各个环节都能降本增效。游戏研发流程本身非常复杂,将其逐个拆分,不一样的环节都会有不同样的占比,好比美术的成本一般可能占到游戏的40-50%左右。我们的策略是让各个环节都能实现降本增效——不是单点地去做某一方面的工具,而是缔造一整套生产力工具。
把算法和大模型应用到场景中
NBD:在“爆红”几个月后,ChatGPT的流量在今年6月出现了环比下降,一些观点聚焦在了通用大模型如何落地的问题。对此,行者AI如何看待?又会采取何种应对措施?
尹学渊:我们现在比较关注一个点,就是大家怎么在“最后一公里”去落地。在我看来,当前的AI与上一代的AI相比,的确有许多不同之处,尤其是在“涌现”之后展现出的理论推理能力。
然而,你会明显地感受到它还是不能满足人们的切实需求。大模型看起来似乎炉火纯青,可是一旦仔细去用,好像又啥都做不了,它就是差那么一点点。打个比方,大模型可能更像一个教育好的高中生,有相应的理论推理能力、语言表达能力等。可是如果一个高中生直接走上职场,会不会觉得怎么都弱了一点?所以应该到大学里面选择学习一个专业,有了精湛的知识才能服务好具体行业。
“最后一公里”其实是我们从业者要去解决的问题。在未来,大模型结合领域专家的垂直模型可能更有市场空间或应用场景。因此,我们采取的策略更多是把算法和大模型应用到场景中,要能为行业服务。
NBD:AI技术不断创新,市场竞争也很激烈。以AI绘画为例,从去年开始,以Stable Diffusion、Midjourney等为代表的AI绘图软件已在业界掀起热议,其能力迭代之快引人侧目。这对于行者AI有何影响?准备如何应对?
尹学渊:像Stable Diffusion,几乎每周都有新版本、新插件。在此环境下,发表的论文也好,开源社区的新动向也好,算法、底层模型、插件的迭代也好,第壹时间我们都会去跟踪。
其实,包含这些软件在内的快速迭代对我们来说还是一个助力。它们可能迭代得非常快,甚至每天都有新东西出来,可是你会发现大家去用它们解决实际问题时,还是会有各种各样的地方处理得不好。
这背后需要结合“Know-How”,(设计)一套自己的工作流,是开源社区无法帮助完成的。好比开源的Linux,其实不是哪个拿它都能做一个好用的操作系统。AI开源工具也一样,需要结合领域内的知识,知道大家在行业里要啥,在此基础上进行迭代和更新,才可能做出好用的产品。
NBD:具体来看,行者AI推出的AI绘图软件是怎样结合“Know-How”的?
尹学渊:目前,行者AI的AI绘图软件主要有两个版本,一是行者AI美术专业版,二是上手门槛更低的图刷刷。背后实际就是三个词——高可控、一致性、高精度。
先说高可控,既然是生产力工具,那就不能是个玩具。要画一个红衣服的女孩,她就一定是红衣服,要一个跳起来的姿势她就需要跳起来,要一个中国风她就务必要是我国风。而且力度控制要做得很细,而不是出现无数个提示词,最后仍然没有达到要求。
其次,保证有一致性。当前的AI绘图软件已经能把一幅画画得很漂亮,可是在实际的应用场景中,画风要保持一致,里面出现的角色也应该是连续的。不然画得再漂亮,也无法具体运用。最后就是高精度,出的图片一定是真正(在精度上)能用得上的。
我们在这个工具里面会做一些工作流。好比批量出图,因为只有能批量出图,才可能进入到生产环节。毕竟AI做的东西在目前还不是100%地可用,因此我们会用出图率来衡量,一批图里能选出的越多,就越能节省生产力。
AI是助手不是对手
NBD:目前看来,强化 人工智能 的监察管理已经成为共识,有关生成式AI的话题也不乏争议。在这其中,版权和质量问题的讨论尤甚。一种典型的疑惑声音认为,生成式AI的作品不仅容易侵权,产出的质量也“难于表达”。行者AI如何避免上述提到的问题?
尹学渊:有关版权的问题刚好问在我们行者AI产品设计的理念上面,第壹个叫做“可用”,第贰个叫“好用”,第叁个点其实叫做“敢用”。可控、一致性、高精度保证“可用”;降低操作门槛、一键快捷功能、增加出图率和批量出图让产品“好用”;这个问题正好是“敢用”。
敢用又分为两个条理,第壹个是 知识产权 ,第贰个是合规性。
先说 知识产权 ,当前的大模型,更多可以解读为它消耗了全世界的素材,可是为了做到高可控、一致性、高精度,尤其是一致性,才能确保可用,那就需要训练自己的画风。我们的工具有训练模型的功能——“一键炼丹”,现在服务的顾客几乎都会用自己的素材投喂AI,在训练画风的同时也在避免侵权:用户使用自己的素材,训练自己的模型,这个模型仅提供给自己使用。
在合规性上,当出现与常见的道德观、法律法规和不同国家地区民俗相违背的内容时,AI能施展很大的作用,这也是为啥行者AI会有一条AI安全的产品线。
至于产出质量的问题,的确,如果只拿AI来做,有些地方就是有瑕疵,或多或少可能现在还没有达到我们脑海中对AI的向往,好像一提自动驾驶就一定得是 L5级别。其实,今天大多数厂商还在L2到L3的进程中,这仍然是有价值的。
你务必要去把它变成工具,进行AI跟人之间的反复交互与创作。在AI的协助下,虽然(一个作品)其实不是一秒钟就做出来了,但可能两周的工作量实际上花三天就完成了,这样难道不好么?我们看待AI,务必要把它当成助手,而不是对手。
NBD:游戏行业一个典型的现象是,游戏厂商纷纷提出“精品化”的旗帜。在此情境下,AI造成的降本增效能够解决什么问题?我们观察到,除了游戏行业,行者AI也在进行一些探索,好比缔造AI音乐教室,这背后的考虑是?
尹学渊:在存量市场,谁具有成本的优势,谁就更容易做出好东西。在保证游戏品质不变的情景下,很多游戏公司都期待以更低的成本把游戏做出来。AI作为降本增效的工具,其落地是一个非常不错的 势头。
其次,我们能不能去扩展游戏的外延?不仅靠游戏休闲娱乐,我们还能给它赋予一些像教育、医疗、陪伴的应用场景。我认为在未来这是一个很大的 势头,我们也在探索。
好比AI音乐教室就是去启发小朋友们的创造力。在以前,自己要创作一首歌是一件很艰难的事情,这里面包含旋律,还有不同样的乐器。在小朋友的知识还没有那么完整的时候,AI的出现恰好可以弥补这一部分的知识,好比告诉它“今天你很开心,来一段愉快的旋律”之类的。
另外,AI医疗的场景我们也在探索。目前我们跟全国某知名医院有一个合作项目,做老年人的游戏,让老年人的脑部活跃起来以预防老年痴呆。游戏里我们会设计一些记忆、语言表达、逻辑推理的点,来刺激他们大脑中的不同区域。
NBD:回看行者AI的发展历程,团队建立的2016年刚好遇上AlphaGo的热潮,今年又站在以ChatGPT为代表的生成式AI的浪潮之中。其实, 人工智能 在期间也经历了爆红-遇冷-再爆红的过程。行业跌跌宕宕,行者AI的要领论是啥?如今又在风口,有何愿景?
尹学渊:我最大的说法或体会是——风口都不是追来的,而一定是等来的。当你坚信一件事情一定会发生的时候,你就应该去好好地沉淀自己。
去年年底推出的ChatGPT用上了基于人类反馈的强化学习,也就是RLHF(Reinforcement from Human Feedback),加了这个东西它才像人。当Transformer模型和RLHF结合的时候,就会发生新的一个化学反应,在我们看来, 人工智能 今天的成果,也是始终在迭代,其实不是说突然一下就“起飞”了。
新闻每天都在说AI工具的事情,实际上能够每天把AI工具完全融入到生产流程的企业或是开发者还是很少,最大的问题还是门槛太高了。
行者AI希望成为一个帮助游戏甚至文娱公司降本增效的平台,我们希望把工具做得更加简单易用,让大伙可以一键上手。以后大家只要有一个idea,你就可以创作,而且这种内容不只是游戏。