AI大模型加速落地 “新蓝海”如何开拓

【编者按】

当前，生成式人工智能技术在多个领域展现出广泛的应用潜力，逐渐成为科技领域的关注焦点。
国家互联网信息办公室最新数据显示，截至目前，我国已经完成备案并上线、能为公众提供服务的生成式人工智能服务大模型已达180多个，注册用户突破5.64亿。
大模型如何进一步赋能千行百业？今后还需要在哪些方面重点发力？本期，我们邀请专家学者就生成式人工智能发展过程中遇到的难点问题和未来发展趋势进行探讨，为读者呈现这一领域的最新动态。

在这里插入图片描述
云南昆明，观众在第八届南博会上等待AI机器人制作素描画像。新华社发

本期嘉宾：

清华大学新闻与传播学院教授陈昌凤
中央财经大学法学院教授朱晓峰
上海交通大学人工智能学院教授严骏驰

在这里插入图片描述
工作人员在湖北武汉一家AI智慧产业园的展示中心内工作。新华社发

大模型是通向通用人工智能的路径吗？

记者：有人说，大模型改变了人类对于整个世界的认知方式，让我们看到了实现通用人工智能的路径。您对这个观点怎么看？

**朱晓峰：**相较于传统的人工智能，以大模型为核心的人工智能具有自主生成能力，不再是人类工程师教它什么，它会什么，而是在一定程度上像人类一样具有了自主学习和输出能力，可以从事那些人类工程师未事先赋予其相应能力的工作。这与通用人工智能的方向具有一致性。一般认为，通用人工智能具备三个关键特征，分别是自主定义任务、完成无限任务以及由价值驱动。虽然现有的生成式人工智能还不具备其中的任何一个特征，但大模型的出现和迅速发展，使我们看到了实现通用人工智能的可能道路。从这个意义上讲，这个判断是准确的。

**严骏驰：**大模型技术正在以惊人的速度重塑我们对世界的认知，并为未来的智能技术开辟了广阔的前景。这些技术通过处理和分析大量数据，展现出了令人瞩目的智能特性。然而，要实现真正的通用人工智能，我们可能还需要更深入的理解和更复杂的技术创新。

一方面，我们要知道大模型的“智能”并不是真正意义上的“智能”。当前的大型模型虽然在规模上达到了前所未有的水平，但它们的智能层次仍有局限性。这些模型能够执行特定的记忆任务，然而，真正的智能远不止于此。它涉及复杂的因果推理、逻辑思维等高级认知能力，这些是目前大模型所缺乏的关键要素。要实现通用人工智能，我们必须超越这些局限，模拟出更接近人类智能的全面认知能力。

另一方面，我们需要了解实现真正“智能”的关键所在。大模型的智能程度高度依赖于数据和计算资源，这种依赖导致它们的智能更多是基于统计和记忆，而非深刻的理解或创造性。真正的智能应该能够识别和纠正现有知识的不足，并有能力探索和创造新知识。这是目前大模型所未能触及的领域，也是未来智能技术发展的关键所在，我们还需要创新的算法和更深层次的认知理解。

大模型技术的发展为我们展示了实现通用人工智能的潜在路径，未来的智能技术发展将依赖我们在认知模型、算法创新和伦理研究等方面的持续努力和探索。

**陈昌凤：**反过来说，是人类的认知革命驱动了大模型的诞生。大模型是科学发展与哲学变迁的产物。牛顿经典力学理论带动了自然科学的第一次大发展，催生了与之相适应的哲学思维——整个宇宙是机械运动的结果，生命乃至人类也可被看作机器，生命运动可以用机械运动去解释了。

从20世纪中期开始，伴随着生物学和计算机科学的发展，人们尝试以计算的抽象思维去认识和把握世界。人工智能的奠基者图灵把人的大脑看作离散态的机器，论证认为人类心灵活动实质上是信息处理过程。计算机的奠基人冯·诺依曼提出细胞自动机的理论，认为生命的本质是计算的过程，此后更多的研究用计算思维来认识和理解生命，将生命的过程还原为计算的过程。

认知科学由此也掀起了变革热潮。人类智能的可计算性是基础，认知计算主义认为，人类大脑和计算机都被看作一套处理符号的形式系统，人类的计算、感知和认知等智能行为，都可以被数据化、符号化，成为计算机模拟、处理的对象。这些都是人工智能发展的理论基础。在尝试了不同的路径之后，辛顿等科学家研究出了深度学习、神经网络系统，从而驱动了这一轮大模型的诞生。可以肯定的是，这一场技术变革将带来更深层次的认知变革，将进一步破解人类的思维密码。

在这里插入图片描述
上海，观众在世界人工智能大会上的AI模型平台屏幕前交流讨论。新华社发

高质量中文语料短缺难题如何破解？

记者：目前普遍认为，大模型技术的发展仍面临诸多挑战，其中最突出的问题之一是数据支持的不足，尤其是高质量的中文语料短缺，难以支撑算法模型的持续迭代和优化。这个问题如何破解？

**陈昌凤：**当前，国际最先进的大模型几乎已经“学完”了人类已有的可获得的数字化文献。有研究指出，根据2023年数据消耗速度，高质量语言数据将在2026年前被耗尽，低质量语言数据将在2030年至2050年被耗尽；视觉数据将在2030年至2060年被耗尽。

国际上，文本数据使用殆尽，而数据流通与版权保护形成的矛盾也限制了大模型的数据可使用性。已经有很多信息巨头公司正在将视觉化信息、音频类信息转为可训练的文本数据。有消息指出，大量转录的音频数据已经用于模型训练，不少“合成数据”也已经开始受到青睐。

中文数据方面确实存在先天不足。一方面，在上世纪末的数字化浪潮中，中文领域对数字化的重视和投入均不足，初期的数字化信息质量也参差不齐，欠缺再利用的价值；另一方面，网络信息存储和数据化建设均难与技术发展相同步、相匹配。此外，迄今引进的部分数据库，带着固有的价值观烙印。亡羊补牢，为时未晚。如果从顶层设计部署到实践落实能够重视、弥补，相信仍有意义。

**严骏驰：**在大模型技术发展的道路上，高质量中文语料的短缺问题日益凸显，成为制约技术迭代和优化的重要因素。为解决这一挑战，可以通过以下措施来提升中文语料的质量和可用性：

一是挖掘和整合国内中文资源。我国拥有庞大的中文报纸、期刊、网站和App资源，这些都是构建高质量中文语料库的重要基础。例如，中国的报纸种类繁多，App市场活跃，国家图书馆的中文藏书也极为丰富。我们需要深入挖掘和整合这些资源，以提升中文语料的质量和多样性。

二是加强数据合规监管。政府部门和监管机构需要建立相应的监管机制，以确保人工智能领域的数据合规。这包括对大模型的数据采集来源、处理方法以及合规性进行监督和审查。同时，我们还需建设集中的数据共享平台，在保证数据合规的前提下，增强中文数据的可用性，以推动大模型技术的发展，同时保障各方的合法权益。

**朱晓峰：**还有两点也很重要。一是建立统一的中文语料库编码规范标准，提高中文语料数据的可使用性。我国目前的中文语料库的国家标准有《信息处理用现代汉语分词规范》《信息处理用现代汉语词类标记规范》等，但这些只是作为推荐性标准，行业采用率不高。实践中不同中文语料库采用不同的编码规范标准，形成了语料库之间的异构性，数据资源之间难以相互转换，同时导致重复建设。对此，考虑到元数据标准规范是中文语料库标准规范中最有条件、最容易实行的规范，可以依据这一规范，建设相应的中文语料库。

二是建立Web检索，搭建由国家、省市图书馆和各高校图书馆主导的中文语料库资源共享平台，推动中文语料库共享进程。Web检索为语料库的访问提供了便利，但在实际应用中，尤其是对于语言信息处理研究和人工智能的使用来说，往往需要获取语料库的全文或特定子库的内容，这就对现有的Web检索系统提出了更高的要求，即需要建立更加广泛、全面且易于使用的中文语料库资源，以便满足这些高级需求。这意味着在现有Web检索技术的基础上，还需要不断优化和完善语料库的组织结构、检索方式以及用户界面等，以提高语料库资源的可访问性和易用性。
在这里插入图片描述
重庆两江新区一汽车工厂内，AI智能检测系统在检测车辆的螺栓松紧程度。新华社发

大模型的“新蓝海”在哪里？

记者：目前，大模型已经在自动驾驶、医疗健康等领域展现出巨大潜力。未来，大模型可能会在哪些领域开拓出新的“蓝海”市场？

**陈昌凤：**大模型横空出世不足两年，一些“大模型”已经朝着“小模型”的方向转变，比如着力于开拓垂类应用模型——教育类、金融类、政务服务类、媒体类、医疗健康类等，并取得了可见的成效。一些可能朝着更细化的AI Agent（智能体）应用方向发展。目前一些人工智能产业正从应用层中寻求创新和价值。

**严骏驰：**现阶段，我国生成式人工智能的应用主要聚焦于医疗、汽车、教育、金融、文化等消费级场景，但在高精尖领域，如自动化定理证明、电路芯片设计、科学文档理解和发现以及图表理解等方面，大模型技术的应用潜力尚未得到充分开发。这些领域对于技术的要求更高，同时也具有更大的创新空间。

大模型技术在数学和逻辑推理方面有很大的潜力。通过处理和分析大量的数学和逻辑数据，大模型可以辅助自动化定理证明，提高证明过程的效率和准确性。例如，大模型可以辅助证明复杂的数学定理，帮助数学家解决一些长期未解的问题。此外，大模型还可以辅助自动化推理，例如在编程语言和形式化验证中的应用，从而提高软件开发和系统设计的效率和质量。

大模型技术在芯片设计领域也值得关注。通过引入大模型技术，可以优化设计工作流程，缩短设计时间，并优化功耗、性能和面积。这不仅提高了设计效率，还帮助开发者解决整个系统堆栈中的复杂问题。此外，大模型还可以协助完成一些重复性的探索工作，帮助开发者更快达成目标，如优化测试周期、提高覆盖率并最小化测试向量数量等。

大模型技术在科学文献分析方面的应用也显示出巨大潜力。通过处理和分析大量的科学文献数据，大模型可以帮助科学家更好地理解和发现科学知识。例如，大模型可以辅助科学家从大量的科学文献中提取关键信息，发现新的科学关联和趋势，从而推动科学研究的进展。此外，大模型还可以辅助科学文献的自动分类和索引，提高科学文献的检索效率和准确性。

在大模型技术的发展中，图表理解领域的研究也值得期待。大模型技术能够帮助理解和分析图表数据，提取关键信息，并应用于各种领域，如市场分析、金融预测等。这种技术的应用能够提高数据分析和决策制定的效率和准确性。

**朱晓峰：**大模型技术的特性和产业发展的要求决定了其需要大规模和长周期的投入和布局。在此过程中，我们不仅要尊重市场规律，肯定企业自身的努力，更要充分发挥国家层面的引导作用。例如在大模型基础设施建设、产业引导等方面，做出更多政策上面的引导和支持。

同时，在一些特定领域，如医疗、生命科学、数字城市等，我国拥有独特的优势。应当充分利用并发挥这些优势，通过大模型来驱动创新，从而带动人工智能产业的全面发展进步。

如何系统的去学习大模型LLM ？

作为一名热心肠的互联网老兵，我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。

但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的 AI大模型资料 包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

所有资料 ⚡️ ，朋友们如果有需要全套《LLM大模型入门+进阶学习资源包》，扫码获取~

👉[CSDN大礼包🎁：全网最全《LLM大模型入门+进阶学习资源包》免费分享]👈

目标：了解AI大模型的基本概念、发展历程和核心原理。
内容：
- L1.1 人工智能简述与大模型起源
- L1.2 大模型与通用人工智能
- L1.3 GPT模型的发展历程
- L1.4 模型工程
  - L1.4.1 知识大模型
  - L1.4.2 生产大模型
  - L1.4.3 模型工程方法论
  - L1.4.4 模型工程实践
- L1.5 GPT应用案例

阶段2：AI大模型API应用开发工程

目标：掌握AI大模型API的使用和开发，以及相关的编程技能。
内容：
- L2.1 API接口
  - L2.1.1 OpenAI API接口
  - L2.1.2 Python接口接入
  - L2.1.3 BOT工具类框架
  - L2.1.4 代码示例
- L2.2 Prompt框架
  - L2.2.1 什么是Prompt
  - L2.2.2 Prompt框架应用现状
  - L2.2.3 基于GPTAS的Prompt框架
  - L2.2.4 Prompt框架与Thought
  - L2.2.5 Prompt框架与提示词
- L2.3 流水线工程
  - L2.3.1 流水线工程的概念
  - L2.3.2 流水线工程的优点
  - L2.3.3 流水线工程的应用
- L2.4 总结与展望

阶段3：AI大模型应用架构实践

目标：深入理解AI大模型的应用架构，并能够进行私有化部署。
内容：
- L3.1 Agent模型框架
  - L3.1.1 Agent模型框架的设计理念
  - L3.1.2 Agent模型框架的核心组件
  - L3.1.3 Agent模型框架的实现细节
- L3.2 MetaGPT
  - L3.2.1 MetaGPT的基本概念
  - L3.2.2 MetaGPT的工作原理
  - L3.2.3 MetaGPT的应用场景
- L3.3 ChatGLM
  - L3.3.1 ChatGLM的特点
  - L3.3.2 ChatGLM的开发环境
  - L3.3.3 ChatGLM的使用示例
- L3.4 LLAMA
  - L3.4.1 LLAMA的特点
  - L3.4.2 LLAMA的开发环境
  - L3.4.3 LLAMA的使用示例
- L3.5 其他大模型介绍