安大互联
财经热点 > 财经资讯 > 上海人工智能实验室主任周伯文 - 通专融合是通往AGI的战略路径 - WAIC2024
【人工智能】上海人工智能实验室主任周伯文 - 通专融合是通往AGI的战略路径 - WAIC2024
浏览次数:【248】  发布日期:2024-7-5 8:26:15    文章分类:财经资讯   
专题:人工智能】 【实验室】 【AGI】 【WAIC
 

  AGI落地会有一个高价值区域,这要求模型兼备很强的泛化能力和充分的专业性。区域离原点最近的位置,叫做通专融合的“价值引爆点”,处在这个点的大模型,在专业能力上应超过90%的专业人类,同时具备强泛化能力,即ABI(广义 人工智能 )能力。

  7月4日,2024世界 人工智能 大会暨 人工智能 全球治理顶级别会议(WAIC 2024)在上海开幕。上海 人工智能 实验室主任、首席科学家,清华大学惠妍讲席教授,衔远科技开创人周伯文在WAIC 2024科学前沿主论坛上发表开场报告时,做出上述判断。

  对应AGI发展之路,周伯文创造了两个词:ANI(狭义 人工智能 )和ABI(广义 人工智能 )。周伯文指出,通向AGI的必经之路是ABI,后者在学术上的严格定义为:自监督、端对端、从判别式走向生成式,“ChatGPT出现的时候,基本上实现了这三个要点,即2022年底已经进入ABI时代。”

  图源:上海 人工智能 实验室

  回看AI发展历史,在2016、2017年之前, 人工智能 在专业能力上拥有非常迅猛的进展,但这些模型不具备泛化能力,只在专有任务上表现突出。

  2017年Transformer提出后,大模型开始在泛化能力上的“狂飙”。但当时的大模型在专业能力的进展上极其缓慢,同时造成巨大的能源消耗、数据消耗、资源消耗。

  Sam Altman曾提到,GPT-4的专业能力,大概相当于10%-15%的专家,即便到将来的GPT-5,预期将会提高四到五个点,即用指数级的能源消耗增长换来缓慢的专业能力提升。

  图源:上海 人工智能 实验室

  “谁先进入高价值区域,意味着谁的能力更强,拥有更多的场景和数据飞轮,并因此更早拥有自我进化迭代的能力。”

  周伯文认为,强泛化的专业能力是AI皇冠上的明珠,即通专融合新范式,应瞄准构建一个既具有泛化性又具备专业能力的AI系统,最终能够更高效、更好地适应和解决现实世界中的复杂问题。

  而实现上述目标需要一个完整的技术体系,有三大重点工作要完成。

  第壹,要在基础模型层构建通用泛化能力,尤其是高阶能力,如数理、因果推理等。通过高质量数据的清洗和合成,研发高性能训练框架、高效的模型架构。

  第贰,要在融合协同层将泛化性和专业性有效地结合起来,采用多路线协同的算法和技术,构建比肩人类优秀水平的专业能力。这将使得AI能够在复杂环境中做出决策,将复杂任务分解为更易管理的子任务,制定行动计划,并有效协调多个智能体,以实现群体智能的涌现。

  第叁,在自主进化与交互层,AI能够完成自主探索和反馈闭环。即AI系统需要在真实或仿真世界中自主地收集数据、学习并适应环境。

  “在科学发现领域,通专融合也有着巨大的潜在价值。”周伯文表示。

  2023年初,Nature曾发表过一篇对科研论文发展现状持灰心态度的封面文章,指出“科学进步正在降速”,引发巨大反响。

  “大模型的不确定性和幻觉生成,其实不总是缺陷,而是它的特点之一。”

  周伯文认为,合理利用这种特点,通过人机协同有助于增进科研创新。大模型内部压缩着世界知识,同时具备不确定性生成的特性,极有可能帮助人类打破不同学科领域知识茧房,进行创新式探索。

  通专融合后,AI可以提出科学假设,掌握科学知识、分析实验结果、预测科学现象。进而在反思的条件上,提升AI提出科学假设的能力。

  周伯文介绍称,为了更高效地构建通用基础模型,上海 人工智能 实验室在并行训练及软硬适配协同、高效数据处理、新型架构及推理增强等方面进行了一系列探索。

  举例而言,上海 人工智能 实验室分别在化学和育种两个方向构建了首个开源大模型——书生·化学和书生·丰登。在分析实验结果方面,实验室研发的晶体结构解析算法AI4XRD具备专家级的准确率,并将解析时间从小时级降低到秒级。

  而在预测科学现象方面,训练并持续迭代了风乌气象大模型,在全球中期气象预报上具有可靠的时间和空间分辨率。

  周伯文指出,具身自主探索是实现通专融合的有效手段,也是理解物理世界的AGI的必经之路。但具身智能不只是大模型加 机器人 的应用,而是物理世界的反馈需要及时进化大模型。

  为帮助建立世界模型,上海 人工智能 实验室构建了“软硬虚实”一体的 机器人 训练场——“浦源·桃源”,这是首个城市级的具身智能数字训练场,构建了集场景数据、工具链、具身模型评测三位一体的开源具身智能研究平台。作为大模型与 机器人 的连接层,其涵盖89种场景、10万+可交互数据,最终解决领域内数据匮乏、评测艰难的问题。

  “浦源·桃源”模型同时攻关具身智能的“大脑”与“小脑”。在大脑方面,通过具身智能体在自身状态认知、复杂任务分解分配、底层技能协同控制的三方面创新,第壹次实现了大模型驱动的 无人机 、机械臂、机器狗三种异构智能体协同。

  在小脑方面,通过GPU高性能并行仿真和强化学习,实现 机器人 在真实世界里快速学习,完成高难度动作,单卡1小时的练习就能实现真实世界380天的练习效果。

  在基础模型方面,上海 人工智能 实验室旗下大语言模型书生·浦语2.5,实现了综合性能比肩开源大模型参数的性能。多模态大模型书生·万象,通过渐进式对齐、向量链接等创新技术,实现了用更少算力资源训练高性能大模型的道路。该模型以260亿参数,也能达到了在关键评测中比肩GPT-4的水平。

  “对于可信AGI的未来,我们的态度是坚定而积极的:We must be there. We will be there,我们务必达成,我们终将抵达。”周伯文最后总结道。

手机扫码浏览该文章
 ● 相关资讯推荐
2024-7-8【人形机器人】多家公募竞相直播人工智能大会 - 人形机器人有望迎来贝塔机会
2024-7-8【人工智能】WAIC 2024 - 大模型需要颠覆性应用,依靠技术与产业积累
2024-7-8【大模型】人形机器人正成为行业变革力量 - 2024 - WAIC展现四大趋势
2024-7-7【亚里士多德】2024孔子与亚里士多德论坛将于7月11至12日在北京举办
2024-7-7【大模型】大模型如何-卷-才能制胜?对话面壁智能首席科学家刘知远
2024-7-7【大模型】人工智能大会深观察 - AI爱因斯坦何时才能出现?缩放定律放缓意味着什么?
2024-7-7【XREAL】XREAL参展人工智能大会 - 多款AR设备受追捧
2024-7-7【Meta】南财合规周报-第149期- 实测9款AI产品填高考志愿;欧盟新法向Meta挥刀
2024-7-7【人工智能】中金研究院吴慧敏 - AI将带动中国经济增长比基准水平提高近10%
2024-7-7【人工智能】WAIC展出人形机器人-十八金刚-;李彦宏称没有应用的大模型一文不值
 ● 相关资讯专题
人形机器人】  【人工智能】  【大模型】  【WAIC】  【亚里士多德】  【2024】  【共同体】  【刘知远】  【科学家】  【创业公司】  【XREAL】  【吴克艰】  【智能大会】  【Meta】  【反垄断】  【高考志愿】  【吴慧敏】  【研究院】  【quot】  【英伟达】 
  • 网络建设业务咨询

   TEl:13626712526