中国信息通信研究院云计算与大数据研究所所长何宝宏:大模型开始反向影响对开源的经典

8月11日,由《证券日报》社主办,中国上市公司协会指导,中关村数字产城联盟、数字经济产业促进联盟支持的2023数字经济领航者论坛在北京召开。

中国信息通信研究院云计算与大数据研究所所长何宝宏在主题为“大模型的发展观察”演讲中介绍,硅基智能在2014年至2022年迎来了大爆发,目前,发展的奇点提前抵达,在大算力+大算法+大数据的基础积累下,通用智能发展临界点来临,自主智能、认知增强、效能提升的通用智能发展进入快车道。

从AI技术路径来看,当前的发展阶段进入了向大规模预训练模型收敛的趋势。“自2018年以来,大模型不断涌现,借助预训练技术对海量无标注数据进行自监督学习,可有效解决模型开发作坊式、碎片化问题。”

从框架层面来看,“基础-微调”已经确立。而针对不同场景,2C和2B对应的通用大模型和垂类大模型适应的企业群体有明显差别,“通用大模型对标ChatGPT,面向公众,而且提供的标准化服务,聚焦基础层的开发和应用,这适应于拥有财力和数据实力的大型科技公司;而聚焦领域问题、面向企业的2B垂类大模型,是以产品和解决方案进行研发和业务开展,在通用大模型基础上训练场景化专用模型,例如,金融、医疗、教育、养老、交通等,这对中小科技公司、传统企业、创业公司比较适用。”何宝宏说。

基础大模型和行业大模型未来将会走向融合发展。何宝宏认为,大模型虽然刚刚兴起,但发展路径可以参考智能终端操作系统的发展历史,围绕某家企业形成闭源生态和围绕开源社区形成开源生态的现象会重演。需要注意的是,围绕开源大模型的挑战很多,其中重要一条是大模型开始反向影响对开源的经典定义。

何宝宏同时提示,也要关注到大模型发展过程中的风险事项,比如基于技术上的模型优化、数据管理、算力资源、模型部署等问题;基于心理层面的来自数据和训练的幻觉;基于社会层面的信息泛滥、伦理道德问题等。此外,大模型发展过程中,大量的数据需要做优化,只是当前面临的困难是,如何筛选出需要优化的数据。

中国工程院院士邬贺铨:数字新基建和数实融合培育万亿元规模产业…

中国工程院院士王国法:以煤矿智能化为支撑的新业态高质量发展 …

中国交通通信信息中心党委委员、副主任林榕:依靠战略、价值、数…

吴学义:大胆拥抱数字经济、数智经济和人工智能时代浪潮,大模型…

何宝宏:围绕开源大模型的挑战很多,其中重要一条是大模型开始反…