周鸿祎委员:以产研协同和开放生态模式,推进人工智能大模型技术创新发展

2023-03-02 中国发展网

中国发展网讯 近期,ChatGPT所取得的技术突破引起学术界和产业界的热烈讨论。全国政协委员、360集团创始人周鸿祎表示,ChatGPT不仅仅是搜索引擎的加强版,也不仅仅是一个聊天机器人,它通过SaaS方式所提供的人工智能服务,将重塑所有的数字化应用和所有行业,带来了一场新的工业革命。面对ChatGPT为代表的人工智能大模型技术的巨大跃升,中国理应迎头赶上,奋起直追。在关注技术层面创新的同时,更要关注技术突破背后所依赖的创新模式。

对于ChatGPT背后的关键成功因素,周鸿祎指出了以下三点:

首先是“微软+OpenAI”的产研协同模式。ChatGPT的成功是大型企业+科研机构协同创新的典范。微软在协同创新中充分发挥了大型科技企业的优势,一是对模型工程化调优的支持,二是大规模算力支持,三是训练数据的抓取,四是帮助改善用户体验,五是提供用户流量的支持,收集用户反馈提升强化学习效果,六是商业化模式的探索,七是基于浏览器、搜索引擎探索用户使用场景,八是巨大且持续的投资支持。在这样的全方位支持下,OpenAI可以专注于学术研究,在技术路线上坚持长期主义,不断吸引尖端人才,持续打磨算法和模型,不断向前推进技术边界。两方优势互补,二者缺一不可,共同支撑了这一重大的技术创新。

其次是基于开源和众包的开放创新模式。ChatGPT的成功也是开源、合作和众包的典范。第一没有开源就不会有ChatGPT的诞生,一是ChatGPT本身就是基于开源算法不断完善的结果,初代GPT建立在谷歌公司开源的Transformer算法之上,吸收了业界大量开源成果,并且GPT1、GPT2都已经开源;二是ChatGPT所使用的训练数据大部分是开源数据集,包括Common Crawl、WebText2、维基百科、书籍、期刊、开源代码等数据,比重超过90%。第二开源也促进了整个产业的共同发展,而不是技术被垄断在少数公司手里。通过开放论文、开源代码,微软、谷歌、脸书等大型公司以及众多创新型中小公司齐头并进,不断推进着技术进步。第三,ChatGPT的训练和调优应用了大规模的众包模式,一是外包了人工标注和人工排序的工程性工作;二是通过开放接口,在供全球用户使用的同时也收集了海量的真实提问以及点赞或者负向反馈,使得模型不断调优。

最后是以通用大模型为中心的生态创新模式。ChatGPT是一个通用的大语言模型,只有开发出各种各样的垂类应用才能连接百行千业,服务于传统产业的数字化、智能化转型。OpenAI在应用创新上不搞一家通吃,而是把ChatGPT通用大模型作为一个操作系统或者应用商店,面向创业者和创新型中小企业开放能力,扶持上百家中小公司孵化各行各业的垂直应用,使得各行各业无需再“大炼大模型”,可以专注于开发行业领域的智能化应用。目前,引用ChatGPT开放接口的应用已多达上千个,各类问答、代码生成、内容创作等新应用如雨后春笋不断涌现,产业生态快速发展。

对此,周鸿祎建议:

一是建立大型科技企业+重点科研机构的产研协同创新模式,打造中国的“微软+Open AI”组合引领大模型技术攻关。建议从建设国家战略科技力量高度出发,筛选技术基础好的产研机构,组成优势互补的产业协同组合,发挥科研机构在关键核心技术上的研究优势,同时发挥大型科技企业在产品化、工程化、场景化、商业化和数据化方面的优势,成为大模型技术攻关和应用的引领龙头。

二是支持设立多个国家级人工智能大模型的长期开源项目,打造开源众包的开放创新生态。人工智能大模型不应成为少数公司垄断的高级技术,而应最大发挥其对于产业和社会的价值。建议针对多条技术路线以开源模式设立多个国家级长期项目,以大型科技企业+重点科研机构为龙头,通过开源、合作、众包和生态的创新模式,引导高校、科研机构和创新型企业形成多个技术路线的创新生态群,一方面降低技术路线选择错误带来的风险,另一方面避免技术成果垄断在少数机构手中,促进更大广度的科技创新和产业发展。