大模型是上海科创版图的关键“拼图”

银发网 2024-07-09

来源：2024年7月5日《文汇报》本报记者徐晶卉

　　在今年的世界人工智能大会上，大模型依然是全场的一个焦点，众多企业争相在现场发布更新迭代的信息，呈现出百花齐放的态势。

　　从辨别式AI逐步走向生成式AI，大模型改变了人工智能的方向。中国在大模型领域的竞争有什么新趋势？上海的大模型生态又有哪些独特优势？上咨集团上咨国际数字化研发部主任张凌毅日前接受了记者的采访。

　　降低使用门槛，大模型加速普及

　　张凌毅表示，今年以来，大模型在应用端、供给端和政策端都有新趋势，表现在应用端普及加速、供给端形成不同赛道、政策端“放与管”齐头并进。

　　在应用端，随着国内大模型的飞速发展，越来越多的网民可以在日常生活中使用到大模型，使用门槛降低带来了普及度加速。一方面，国内主流大模型厂商几乎都推出了可免费注册的应用或者小程序，基本已超过ChatGPT3甚至达到ChatGPT3.5的水平。另一方面，国内办公软件、视频图片处理软件、新能源车载系统、导航软件等应用中，也都新增或丰富了相关功能，让更多普通人可以接触和使用生成式AI，提升个人工作及生活的效率。

　　张凌毅认为，未来企业在应用端将逐步回归商业逻辑，即在技术、成本、产品和市场之间找到动态的最佳平衡，同时深入某一细分领域做深做透，形成通用大模型不可替代的场景化能力或者用户体验。

　　在供给端，大模型公司将逐渐划分并形成不同赛道，包括基础芯片、算力供应商等底层服务供应商，有底层自主可控和规模化能力的一批硬科技公司等。而在政策端，大模型的“放与管”正齐头并进，比如，去年出台的《生成式人工智能服务管理暂行办法》，对模型的训练语料和内容生产配套了相应标准和政策研究，促进了行业的规范有序发展。此外，一系列促进行业应用的政策，也推动大模型的自主创新和应用迈向新台阶。

　　突出顶层设计，构建大模型生态

　　根据国家网信办今年4月发布的信息，全国现有117款生成式AI服务通过备案，其中上海占据24款，数量列全国第二。市网信办6月13日最新数据显示，上海备案大模型数量已达34款。

　　在张凌毅看来，上海在发展AI大模型和生成式AI方面具有3个独特优势。首先，政府顶层设计较好，推进力度大，前瞻性强。去年发布的《上海市推动人工智能大模型创新发展若干措施（2023—2025年）》明确提出，打造市级智能算力统筹调度平台、构建智能芯片软硬协同生态、推进语料数据资源共建共享、打造企业和人才集聚的大模型创新高地、实施大模型示范应用推进计划等一系列具体举措。在相关政策的推动之下，上海很快在算力和语料领域成立了专业运营公司，为大模型的训练和优化提供了充足的动能和燃料。

　　其次，AI、集成电路已被纳入上海三大先导产业，打造并形成AI和集成电路产业链，吸引了一系列上下游企业和优秀科研人才聚集，为生成式AI发展提供了丰富的产业资源和合作机会。

　　再次，上海具备多样的应用场景，涉及智能制造、生物医药、创意设计、自动驾驶、机器人、数字政府等众多领域，这些场景需求有助于推动技术的不断创新和优化，加速大模型落地和商业化进程。

　　催生科学研究新范式，形成联动效应

　　“在上海科创中心建设的版图上，不能缺了大模型这一关键‘拼图’。”张凌毅表示，“大模型以及生成式人工智能，在可见的未来将催生科学研究新范式，并与其他前沿科技形成联动效应。”

　　他以科学智能为例：在基础研究阶段，科研人员以往需要大量精力来阅读科研文献，如今可以将大模型的通用语言能力与文献知识库（RAG技术）相结合，抽取凝练关键概念和研究脉络，大大提升科研基础性工作效能；在研发阶段，大模型能在生物计算、模拟计算、材料药物筛选等领域替代传统算法能力，大幅提升效率。“这种新范式将彻底重构人类传统的‘控制-实验-观察’科学方法，进而转为面向多尺度、大规模、高复杂性的科学研究，从问题提出到高精度求解，助力前沿技术再上新台阶。”

　　张凌毅认为，这一轮生成式AI发展目前还处于比较早期阶段，硬件、模型和产品迭代都按月计算，因此竞争才刚刚开始，而这种顶流技术的竞争，从某种程度上也是顶流城市的竞争。立足当下，上海在大模型生态上已有良好布局，下一步应持续推进算力、语料、模型以及应用生态各方面的建设，加速大模型赋能千行百业的步伐，实现原有行业的提质增效和转型升级。同时，针对生成式AI对职业培训、高等教育和基础教育方面带来的新要求和新挑战，上海也需要提前开展相关研究和应对。