【人工智能】何宝宏 - 围绕开源大模型的挑战很多其中重要一条是大模型开始反向影响对开源的经典定义

栏目导航

财经热点 > 财经资讯 > 何宝宏 - 围绕开源大模型的挑战很多其中重要一条是大模型开始反向影响对开源的经典定义

【人工智能】何宝宏 - 围绕开源大模型的挑战很多其中重要一条是大模型开始反向影响对开源的经典定义

浏览次数：【579】发布日期:2023-8-11 17:44:16 文章分类：财经资讯

专题：【人工智能】

　　尊敬的邬贺铨和王国法院士，很高兴跟大家交流一下大模型最新发展。我我读研究生的时候就是学人工智能，后来因为不太好找活干，我就转型去做互联网研究了，没有想到几十年之后，又回来去做回人工智能，可是今天的人工智能看起来是神经网络。

　　我们也可以看到过去几十年的时间，人工智能在多个领域获得了突破性的进展，尽管它仍然会犯错，可是错误率已经低于人类的平均水平，说白了比大多数人在这些方面的水平要高了。

　　从技术角度而言，人工智能已经发展了60多年了，60长时间以来技术路线是千奇百怪，今天似乎在大模型，预训练的大模型，意味着一个新的产业正在形成当中。

　　这几年从通信基础设施，搞算力的条件设施开始，接着未来几年我们要搞智力的条件设施，因此我们说智商原来是不在线的，现在看起来智商是要在线的，把智商放到网上去了，这个方向看起来已经确立了。

　　第叁个是TOB还是TOC，通用还是精湛的问题，以前讨论很多是对标ChatGPT通用场景的大模型，更多的是要处理基础模型方面的工作，这是一个极为重要的事情。主要是大型科技公司有这种财力和数据实力去做这一方面的事情，可以认为TOC是面向公众，下面很多的方向转向垂类的，务必要聚焦特定领域，面向企业TOB，主要是围绕产品和解决方案来做。如何做垂类的模型，国内外不一样，在硅谷针对特定场景的微调做实验，因为通用大模型还没有出来，不会围绕它做生态，很多企业是全站式的，自上而下在做垂类的模型。这个生态在国内还需要一些时间，可能要求的门槛稍微低一点，这一类可以理解成私有的，或专用的，其实就把云计算十年前的一些做法和一些口号，还有一些套路，往人工智能和大模型一靠，就差不多了。可以很明显，基础大模型和通用大模型的优点和不足，行业垂类大模型也有各自的优势和缺点，下一步有可能是走向融合，走向混合。

　　我们要做垂类行业大模型，为了数据的安全，这些数据不能拿出来，很多数据是非常敏感的，肯定大模型要做私有化的部署。过几年的时间，我个人的判断，就像今天的云肯定是一个混合云和混合AI的模式。

　　还有讨论今年的闭源大模型和开源大模型，ChatGPT出来是一定的，这个一定是有各种各样的原因。所以接着对这个行业而言，因为这个行业的特点是赢家通吃，剩下的企业只能抱团取暖，务必抱一个开源社区，大家一起把开源的事情做起来。我们可以认为开源大模型正在刚刚兴起，这个浪潮刚刚开始，谁能胜出还不晓得。当年手机端里面，苹果手机出来之后，接着是安卓生态的建设，这一幕会重演，围绕着开源社区的生态，开源大模型面临着很多的挑战，一个关键的是它反向影响对开源的定义。我们对开源的定义是在25年前出现的，当年定义做的开源规则，针对的是软件，针对的是代码，今天人工智能这个开源针对的是模型，针对的是权重，里面很多数据集，大模型的开源和软件的开源，和代码的开源的确不太一样，因此我们需要在人工智能这个时代重新定义开源，今天面对模型，加了很多的数据，至少我看有三个方面的区别，加了很多科技伦理，因此这一块有AIGC发生一些新的内容，它是一个自循环了，会出现无数的问题。

　　整体来看，国外做了很多的榜单，可是从学术到产业还需要做更多的工作，学术界和产业界关注不一样，产业界主要关注性能，还有可靠性，稳定性，场景适应性怎么样，维护性怎么样，或你的工程能力怎么样，要用工程化和标准化去做这个工作，所以不能单单以学术界的榜单来判断大模型做的好还是不好。

　　目前面临着很多一些新的危险和挑战，有技术、心理和社会方面的危险，模型里面有大量的参数是垃圾，到ChatGPT4到了上万亿，大模型大量的参数是垃圾，问题是你不晓得谁是垃圾，你知道公司有人在摸鱼，可是你不晓得谁在摸鱼，肯定很多参数在摸鱼，你需要做优化，完全是可以做优化。几年前我们讨论的深度学习的时候，做出的决定是一个黑箱，不能做出解决。深度学习到今天，大模型更不可解释的，因为出现了涌现的现象，突然开窍了，突然开悟了，为啥会开悟了，没法解释。可是用于现实和社会，它务必是可解释的，只有可解释以后，才能跟我们的法律、道德伦理和社会的游戏规则匹配起来，还有算力资源的部署有关系，还有人工智能出现了谜之自信的问题，AI的幻觉，对某些知识非常自信，跟人一样有时候也是谜之自信。

　　在文字方面，人也犯错，所以不要那么苛求，继续努力。在图片方面也相对照较成熟了，美术方面很不错，还有人声合成，对生成音乐和声音相对照较成熟了，模仿一个人的声音时间其实不长，现在很多UP主就是用数字化+ 人工智能训练出来，还有一些视频的，还有编程已经达到了初级程序员的水平，编程就是文字对文字的翻译。还有在科学领域，科学院用的仪器和仪表，也需要人工智能来辅助，还有生物学和材料学等广泛的使用。

　　还有编程，今天的编程是在训练程序，不是在编写程序。算法要完整，数据只要有结构，算法，框架+数据，对算法细节的重要性没有那么重要了，不仅数据要有结构，还要整个输出。所以从编程序变成了训练程序。

　　前几年的移动优先和云优先，我们要优先考虑人工智能对我们的影响。我就讲这些。感谢！

手机扫码浏览该文章

● 相关资讯推荐

2024-9-23【人工智能】-智改数转-赋能制造业灯塔工厂打造竞争新优势

2024-9-21【文化产业】向勇 - 科技如何赋能文化？

2024-9-22【人工智能】南财合规周报-第159期-全民仅退款-APP京淘淘爆雷？网信办拟发布AI-内容水印-

2024-9-21【内幕交易】大数据+人工智能助力监管剑指-守门人-内幕交易

2024-9-19【人工智能】中国式体检20年 - 从例行公事到真的救命

2024-9-17【数据中心】铜价长期将飙升？必和必拓 - AI浪潮将加剧铜短缺

2024-9-14【新能源】携手清华解决可持续挑战 - 远景的又一次零碳试验

2024-9-15【人工智能】服贸会观察 - 大模型遇数据瓶颈、算力不足，电信运营商如何应对