大模型是上海科创版图的关键“拼图”

银发网 2024-07-09

来源:2024年7月5日《文汇报》  本报记者 徐晶卉

  

  在今年的世界人工智能大会上,大模型依然是全场的一个焦点,众多企业争相在现场发布更新迭代的信息,呈现出百花齐放的态势。

  

  从辨别式AI逐步走向生成式AI,大模型改变了人工智能的方向。中国在大模型领域的竞争有什么新趋势?上海的大模型生态又有哪些独特优势?上咨集团上咨国际数字化研发部主任张凌毅日前接受了记者的采访。

  

  降低使用门槛,大模型加速普及

  

  张凌毅表示,今年以来,大模型在应用端、供给端和政策端都有新趋势,表现在应用端普及加速、供给端形成不同赛道、政策端“放与管”齐头并进。

  

  在应用端,随着国内大模型的飞速发展,越来越多的网民可以在日常生活中使用到大模型,使用门槛降低带来了普及度加速。一方面,国内主流大模型厂商几乎都推出了可免费注册的应用或者小程序,基本已超过ChatGPT3甚至达到ChatGPT3.5的水平。另一方面,国内办公软件、视频图片处理软件、新能源车载系统、导航软件等应用中,也都新增或丰富了相关功能,让更多普通人可以接触和使用生成式AI,提升个人工作及生活的效率。

  

  张凌毅认为,未来企业在应用端将逐步回归商业逻辑,即在技术、成本、产品和市场之间找到动态的最佳平衡,同时深入某一细分领域做深做透,形成通用大模型不可替代的场景化能力或者用户体验。

  

  在供给端,大模型公司将逐渐划分并形成不同赛道,包括基础芯片、算力供应商等底层服务供应商,有底层自主可控和规模化能力的一批硬科技公司等。而在政策端,大模型的“放与管”正齐头并进,比如,去年出台的《生成式人工智能服务管理暂行办法》,对模型的训练语料和内容生产配套了相应标准和政策研究,促进了行业的规范有序发展。此外,一系列促进行业应用的政策,也推动大模型的自主创新和应用迈向新台阶。

  

  突出顶层设计,构建大模型生态

  

  根据国家网信办今年4月发布的信息,全国现有117款生成式AI服务通过备案,其中上海占据24款,数量列全国第二。市网信办6月13日最新数据显示,上海备案大模型数量已达34款。

  

  在张凌毅看来,上海在发展AI大模型和生成式AI方面具有3个独特优势。首先,政府顶层设计较好,推进力度大,前瞻性强。去年发布的《上海市推动人工智能大模型创新发展若干措施(2023—2025年)》明确提出,打造市级智能算力统筹调度平台、构建智能芯片软硬协同生态、推进语料数据资源共建共享、打造企业和人才集聚的大模型创新高地、实施大模型示范应用推进计划等一系列具体举措。在相关政策的推动之下,上海很快在算力和语料领域成立了专业运营公司,为大模型的训练和优化提供了充足的动能和燃料。

  

  其次,AI、集成电路已被纳入上海三大先导产业,打造并形成AI和集成电路产业链,吸引了一系列上下游企业和优秀科研人才聚集,为生成式AI发展提供了丰富的产业资源和合作机会。

  

  再次,上海具备多样的应用场景,涉及智能制造、生物医药、创意设计、自动驾驶、机器人、数字政府等众多领域,这些场景需求有助于推动技术的不断创新和优化,加速大模型落地和商业化进程。

  

  催生科学研究新范式,形成联动效应

  

  “在上海科创中心建设的版图上,不能缺了大模型这一关键‘拼图’。”张凌毅表示,“大模型以及生成式人工智能,在可见的未来将催生科学研究新范式,并与其他前沿科技形成联动效应。”

  

  他以科学智能为例:在基础研究阶段,科研人员以往需要大量精力来阅读科研文献,如今可以将大模型的通用语言能力与文献知识库(RAG技术)相结合,抽取凝练关键概念和研究脉络,大大提升科研基础性工作效能;在研发阶段,大模型能在生物计算、模拟计算、材料药物筛选等领域替代传统算法能力,大幅提升效率。“这种新范式将彻底重构人类传统的‘控制-实验-观察’科学方法,进而转为面向多尺度、大规模、高复杂性的科学研究,从问题提出到高精度求解,助力前沿技术再上新台阶。”

  

  张凌毅认为,这一轮生成式AI发展目前还处于比较早期阶段,硬件、模型和产品迭代都按月计算,因此竞争才刚刚开始,而这种顶流技术的竞争,从某种程度上也是顶流城市的竞争。立足当下,上海在大模型生态上已有良好布局,下一步应持续推进算力、语料、模型以及应用生态各方面的建设,加速大模型赋能千行百业的步伐,实现原有行业的提质增效和转型升级。同时,针对生成式AI对职业培训、高等教育和基础教育方面带来的新要求和新挑战,上海也需要提前开展相关研究和应对。