AI大模型加速落地 “新蓝海”如何开拓

news2024/9/24 19:54:43

【编者按】

当前,生成式人工智能技术在多个领域展现出广泛的应用潜力,逐渐成为科技领域的关注焦点。
国家互联网信息办公室最新数据显示,截至目前,我国已经完成备案并上线、能为公众提供服务的生成式人工智能服务大模型已达180多个,注册用户突破5.64亿。
大模型如何进一步赋能千行百业?今后还需要在哪些方面重点发力?本期,我们邀请专家学者就生成式人工智能发展过程中遇到的难点问题和未来发展趋势进行探讨,为读者呈现这一领域的最新动态。

在这里插入图片描述
云南昆明,观众在第八届南博会上等待AI机器人制作素描画像。新华社发

本期嘉宾:

清华大学新闻与传播学院教授 陈昌凤
中央财经大学法学院教授 朱晓峰
上海交通大学人工智能学院教授 严骏驰

在这里插入图片描述
工作人员在湖北武汉一家AI智慧产业园的展示中心内工作。新华社发

大模型是通向通用人工智能的路径吗?

记者:有人说,大模型改变了人类对于整个世界的认知方式,让我们看到了实现通用人工智能的路径。您对这个观点怎么看?

**朱晓峰:**相较于传统的人工智能,以大模型为核心的人工智能具有自主生成能力,不再是人类工程师教它什么,它会什么,而是在一定程度上像人类一样具有了自主学习和输出能力,可以从事那些人类工程师未事先赋予其相应能力的工作。这与通用人工智能的方向具有一致性。一般认为,通用人工智能具备三个关键特征,分别是自主定义任务、完成无限任务以及由价值驱动。虽然现有的生成式人工智能还不具备其中的任何一个特征,但大模型的出现和迅速发展,使我们看到了实现通用人工智能的可能道路。从这个意义上讲,这个判断是准确的。

**严骏驰:**大模型技术正在以惊人的速度重塑我们对世界的认知,并为未来的智能技术开辟了广阔的前景。这些技术通过处理和分析大量数据,展现出了令人瞩目的智能特性。然而,要实现真正的通用人工智能,我们可能还需要更深入的理解和更复杂的技术创新。

一方面,我们要知道大模型的“智能”并不是真正意义上的“智能”。当前的大型模型虽然在规模上达到了前所未有的水平,但它们的智能层次仍有局限性。这些模型能够执行特定的记忆任务,然而,真正的智能远不止于此。它涉及复杂的因果推理、逻辑思维等高级认知能力,这些是目前大模型所缺乏的关键要素。要实现通用人工智能,我们必须超越这些局限,模拟出更接近人类智能的全面认知能力。

另一方面,我们需要了解实现真正“智能”的关键所在。大模型的智能程度高度依赖于数据和计算资源,这种依赖导致它们的智能更多是基于统计和记忆,而非深刻的理解或创造性。真正的智能应该能够识别和纠正现有知识的不足,并有能力探索和创造新知识。这是目前大模型所未能触及的领域,也是未来智能技术发展的关键所在,我们还需要创新的算法和更深层次的认知理解。

大模型技术的发展为我们展示了实现通用人工智能的潜在路径,未来的智能技术发展将依赖我们在认知模型、算法创新和伦理研究等方面的持续努力和探索。

**陈昌凤:**反过来说,是人类的认知革命驱动了大模型的诞生。大模型是科学发展与哲学变迁的产物。牛顿经典力学理论带动了自然科学的第一次大发展,催生了与之相适应的哲学思维——整个宇宙是机械运动的结果,生命乃至人类也可被看作机器,生命运动可以用机械运动去解释了。

从20世纪中期开始,伴随着生物学和计算机科学的发展,人们尝试以计算的抽象思维去认识和把握世界。人工智能的奠基者图灵把人的大脑看作离散态的机器,论证认为人类心灵活动实质上是信息处理过程。计算机的奠基人冯·诺依曼提出细胞自动机的理论,认为生命的本质是计算的过程,此后更多的研究用计算思维来认识和理解生命,将生命的过程还原为计算的过程。

认知科学由此也掀起了变革热潮。人类智能的可计算性是基础,认知计算主义认为,人类大脑和计算机都被看作一套处理符号的形式系统,人类的计算、感知和认知等智能行为,都可以被数据化、符号化,成为计算机模拟、处理的对象。这些都是人工智能发展的理论基础。在尝试了不同的路径之后,辛顿等科学家研究出了深度学习、神经网络系统,从而驱动了这一轮大模型的诞生。可以肯定的是,这一场技术变革将带来更深层次的认知变革,将进一步破解人类的思维密码。

在这里插入图片描述
上海,观众在世界人工智能大会上的AI模型平台屏幕前交流讨论。新华社发

高质量中文语料短缺难题如何破解?

记者:目前普遍认为,大模型技术的发展仍面临诸多挑战,其中最突出的问题之一是数据支持的不足,尤其是高质量的中文语料短缺,难以支撑算法模型的持续迭代和优化。这个问题如何破解?

**陈昌凤:**当前,国际最先进的大模型几乎已经“学完”了人类已有的可获得的数字化文献。有研究指出,根据2023年数据消耗速度,高质量语言数据将在2026年前被耗尽,低质量语言数据将在2030年至2050年被耗尽;视觉数据将在2030年至2060年被耗尽。

国际上,文本数据使用殆尽,而数据流通与版权保护形成的矛盾也限制了大模型的数据可使用性。已经有很多信息巨头公司正在将视觉化信息、音频类信息转为可训练的文本数据。有消息指出,大量转录的音频数据已经用于模型训练,不少“合成数据”也已经开始受到青睐。

中文数据方面确实存在先天不足。一方面,在上世纪末的数字化浪潮中,中文领域对数字化的重视和投入均不足,初期的数字化信息质量也参差不齐,欠缺再利用的价值;另一方面,网络信息存储和数据化建设均难与技术发展相同步、相匹配。此外,迄今引进的部分数据库,带着固有的价值观烙印。亡羊补牢,为时未晚。如果从顶层设计部署到实践落实能够重视、弥补,相信仍有意义。

**严骏驰:**在大模型技术发展的道路上,高质量中文语料的短缺问题日益凸显,成为制约技术迭代和优化的重要因素。为解决这一挑战,可以通过以下措施来提升中文语料的质量和可用性:

一是挖掘和整合国内中文资源。我国拥有庞大的中文报纸、期刊、网站和App资源,这些都是构建高质量中文语料库的重要基础。例如,中国的报纸种类繁多,App市场活跃,国家图书馆的中文藏书也极为丰富。我们需要深入挖掘和整合这些资源,以提升中文语料的质量和多样性。

二是加强数据合规监管。政府部门和监管机构需要建立相应的监管机制,以确保人工智能领域的数据合规。这包括对大模型的数据采集来源、处理方法以及合规性进行监督和审查。同时,我们还需建设集中的数据共享平台,在保证数据合规的前提下,增强中文数据的可用性,以推动大模型技术的发展,同时保障各方的合法权益。

**朱晓峰:**还有两点也很重要。一是建立统一的中文语料库编码规范标准,提高中文语料数据的可使用性。我国目前的中文语料库的国家标准有《信息处理用现代汉语分词规范》《信息处理用现代汉语词类标记规范》等,但这些只是作为推荐性标准,行业采用率不高。实践中不同中文语料库采用不同的编码规范标准,形成了语料库之间的异构性,数据资源之间难以相互转换,同时导致重复建设。对此,考虑到元数据标准规范是中文语料库标准规范中最有条件、最容易实行的规范,可以依据这一规范,建设相应的中文语料库。

二是建立Web检索,搭建由国家、省市图书馆和各高校图书馆主导的中文语料库资源共享平台,推动中文语料库共享进程。Web检索为语料库的访问提供了便利,但在实际应用中,尤其是对于语言信息处理研究和人工智能的使用来说,往往需要获取语料库的全文或特定子库的内容,这就对现有的Web检索系统提出了更高的要求,即需要建立更加广泛、全面且易于使用的中文语料库资源,以便满足这些高级需求。这意味着在现有Web检索技术的基础上,还需要不断优化和完善语料库的组织结构、检索方式以及用户界面等,以提高语料库资源的可访问性和易用性。
在这里插入图片描述
重庆两江新区一汽车工厂内,AI智能检测系统在检测车辆的螺栓松紧程度。新华社发

大模型的“新蓝海”在哪里?

记者:目前,大模型已经在自动驾驶、医疗健康等领域展现出巨大潜力。未来,大模型可能会在哪些领域开拓出新的“蓝海”市场?

**陈昌凤:**大模型横空出世不足两年,一些“大模型”已经朝着“小模型”的方向转变,比如着力于开拓垂类应用模型——教育类、金融类、政务服务类、媒体类、医疗健康类等,并取得了可见的成效。一些可能朝着更细化的AI Agent(智能体)应用方向发展。目前一些人工智能产业正从应用层中寻求创新和价值。

**严骏驰:**现阶段,我国生成式人工智能的应用主要聚焦于医疗、汽车、教育、金融、文化等消费级场景,但在高精尖领域,如自动化定理证明、电路芯片设计、科学文档理解和发现以及图表理解等方面,大模型技术的应用潜力尚未得到充分开发。这些领域对于技术的要求更高,同时也具有更大的创新空间。

大模型技术在数学和逻辑推理方面有很大的潜力。通过处理和分析大量的数学和逻辑数据,大模型可以辅助自动化定理证明,提高证明过程的效率和准确性。例如,大模型可以辅助证明复杂的数学定理,帮助数学家解决一些长期未解的问题。此外,大模型还可以辅助自动化推理,例如在编程语言和形式化验证中的应用,从而提高软件开发和系统设计的效率和质量。

大模型技术在芯片设计领域也值得关注。通过引入大模型技术,可以优化设计工作流程,缩短设计时间,并优化功耗、性能和面积。这不仅提高了设计效率,还帮助开发者解决整个系统堆栈中的复杂问题。此外,大模型还可以协助完成一些重复性的探索工作,帮助开发者更快达成目标,如优化测试周期、提高覆盖率并最小化测试向量数量等。

大模型技术在科学文献分析方面的应用也显示出巨大潜力。通过处理和分析大量的科学文献数据,大模型可以帮助科学家更好地理解和发现科学知识。例如,大模型可以辅助科学家从大量的科学文献中提取关键信息,发现新的科学关联和趋势,从而推动科学研究的进展。此外,大模型还可以辅助科学文献的自动分类和索引,提高科学文献的检索效率和准确性。

在大模型技术的发展中,图表理解领域的研究也值得期待。大模型技术能够帮助理解和分析图表数据,提取关键信息,并应用于各种领域,如市场分析、金融预测等。这种技术的应用能够提高数据分析和决策制定的效率和准确性。

**朱晓峰:**大模型技术的特性和产业发展的要求决定了其需要大规模和长周期的投入和布局。在此过程中,我们不仅要尊重市场规律,肯定企业自身的努力,更要充分发挥国家层面的引导作用。例如在大模型基础设施建设、产业引导等方面,做出更多政策上面的引导和支持。

同时,在一些特定领域,如医疗、生命科学、数字城市等,我国拥有独特的优势。应当充分利用并发挥这些优势,通过大模型来驱动创新,从而带动人工智能产业的全面发展进步。

如何系统的去学习大模型LLM ?

作为一名热心肠的互联网老兵,我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。

但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的 AI大模型资料 包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来

所有资料 ⚡️ ,朋友们如果有需要全套 《LLM大模型入门+进阶学习资源包》,扫码获取~

👉[CSDN大礼包🎁:全网最全《LLM大模型入门+进阶学习资源包》免费分享]👈

在这里插入图片描述

一、全套AGI大模型学习路线

AI大模型时代的学习之旅:从基础到前沿,掌握人工智能的核心技能!

img

二、640套AI大模型报告合集

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。

img

三、AI大模型经典PDF籍

随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。

img

在这里插入图片描述

四、AI大模型商业化落地方案

img

阶段1:AI大模型时代的基础理解
  • 目标:了解AI大模型的基本概念、发展历程和核心原理。
  • 内容
    • L1.1 人工智能简述与大模型起源
    • L1.2 大模型与通用人工智能
    • L1.3 GPT模型的发展历程
    • L1.4 模型工程
      - L1.4.1 知识大模型
      - L1.4.2 生产大模型
      - L1.4.3 模型工程方法论
      - L1.4.4 模型工程实践
    • L1.5 GPT应用案例
阶段2:AI大模型API应用开发工程
  • 目标:掌握AI大模型API的使用和开发,以及相关的编程技能。
  • 内容
    • L2.1 API接口
      - L2.1.1 OpenAI API接口
      - L2.1.2 Python接口接入
      - L2.1.3 BOT工具类框架
      - L2.1.4 代码示例
    • L2.2 Prompt框架
      - L2.2.1 什么是Prompt
      - L2.2.2 Prompt框架应用现状
      - L2.2.3 基于GPTAS的Prompt框架
      - L2.2.4 Prompt框架与Thought
      - L2.2.5 Prompt框架与提示词
    • L2.3 流水线工程
      - L2.3.1 流水线工程的概念
      - L2.3.2 流水线工程的优点
      - L2.3.3 流水线工程的应用
    • L2.4 总结与展望
阶段3:AI大模型应用架构实践
  • 目标:深入理解AI大模型的应用架构,并能够进行私有化部署。
  • 内容
    • L3.1 Agent模型框架
      - L3.1.1 Agent模型框架的设计理念
      - L3.1.2 Agent模型框架的核心组件
      - L3.1.3 Agent模型框架的实现细节
    • L3.2 MetaGPT
      - L3.2.1 MetaGPT的基本概念
      - L3.2.2 MetaGPT的工作原理
      - L3.2.3 MetaGPT的应用场景
    • L3.3 ChatGLM
      - L3.3.1 ChatGLM的特点
      - L3.3.2 ChatGLM的开发环境
      - L3.3.3 ChatGLM的使用示例
    • L3.4 LLAMA
      - L3.4.1 LLAMA的特点
      - L3.4.2 LLAMA的开发环境
      - L3.4.3 LLAMA的使用示例
    • L3.5 其他大模型介绍
阶段4:AI大模型私有化部署
  • 目标:掌握多种AI大模型的私有化部署,包括多模态和特定领域模型。
  • 内容
    • L4.1 模型私有化部署概述
    • L4.2 模型私有化部署的关键技术
    • L4.3 模型私有化部署的实施步骤
    • L4.4 模型私有化部署的应用场景
学习计划:
  • 阶段1:1-2个月,建立AI大模型的基础知识体系。
  • 阶段2:2-3个月,专注于API应用开发能力的提升。
  • 阶段3:3-4个月,深入实践AI大模型的应用架构和私有化部署。
  • 阶段4:4-5个月,专注于高级模型的应用和部署。
这份完整版的所有 ⚡️ 大模型 LLM 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

全套 《LLM大模型入门+进阶学习资源包↓↓↓ 获取~

👉[CSDN大礼包🎁:全网最全《LLM大模型入门+进阶学习资源包》免费分享👈

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1981392.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

ABeam 德硕| FY25 Kickoff MeetingDinner 回顾

自律 Self-discipline 7月一整月,ABeam中国各office相继举办了新财年的Kickoff会议。Kickoff意为启动,在这个场合,所有员工将一同参会,作为新财年的启幕仪式。 今年ABeam中国以“自律”作为年度主题,本次全站Kickoff…

Java获取exe文件详细信息:产品名称,产品版本等

使用Maven项目&#xff0c;在pom.xml文件中注入&#xff1a; <dependency><groupId>com.kichik.pecoff4j</groupId><artifactId>pecoff4j</artifactId><version>0.4.1</version></dependency> 程序代码&#xff1a; import …

电脑技巧:9个免费的AI图片无损放大工具和网站

今天小编给大家介绍9款免费的AI图片放大工具和网站&#xff0c;帮助你提高图片清晰度&#xff0c;感兴趣的朋友可以自己试一试&#xff01; 电脑技巧&#xff1a;9个免费的AI图片无损放大工具和网站 美图设计室 美图设计室是美图秀秀公司推出的一款在线图片编辑和设计工具箱&…

基于ESP32的遥控小车

目录 1.ESP32简介 2.项目构思 3.项目所需材料 4.代码示例 5.实物运行 1.ESP32简介 ESP32是一个集成天线和射频巴伦、功率放大器、低噪声放大器、滤波器和电源管理模块。整个解决方案占用的印刷电路板面积最少。该板采用台积电40nm低功耗技术的2.4GHz双模Wi-Fi和蓝牙芯片&…

计算机网络基础 - 计算机网络和因特网(2)

计算机网络基础 计算机网络和因特网Internet 结构和 ISP分组延时、丢失和吞吐量四种分组延时分组丢失吞吐量 协议层次及其服务模型概念数据单元&#xff08;DU&#xff09;协议栈TCP/IP 协议各层次的协议数据单元IOS/OSI 参考模型 计算机网络和因特网的历史早期计算机网路&…

RTSP系列三:RTP协议介绍

RTSP系列&#xff1a; RTSP系列一&#xff1a;RTSP协议介绍-CSDN博客 RTSP系列二&#xff1a;RTSP协议鉴权-CSDN博客 RTSP系列三&#xff1a;RTP协议介绍-CSDN博客 RTSP系列四&#xff1a;RTSP Server/Client实战项目-CSDN博客 目录 一、基本概念 二、RTP报文格式 三、R…

代码随想录训练营 Day21打卡 二叉树 part08 669. 修剪二叉搜索树 108. 将有序数组转换为二叉搜索树 538. 把二叉搜索树转换为累加树

代码随想录训练营 Day21打卡 二叉树 part08 一、 力扣669. 修剪二叉搜索树 给你二叉搜索树的根节点 root &#xff0c;同时给定最小边界low 和最大边界 high。通过修剪二叉搜索树&#xff0c;使得所有节点的值在[low, high]中。修剪树 不应该 改变保留在树中的元素的相对结构 …

密码学基础:搞懂Hash函数SHA1、SHA-2、SHA3(2)

目录 1.引入 2. SHA512-224\256 3.SHA-3 4.MD5 5.SM3 1.引入 上篇密码学基础&#xff1a;搞懂Hash函数SHA1、SHA-2、SHA3(1)-CSDN博客&#xff0c;我们先就将基础的SHA1\2讲解了&#xff0c;接下来我们继续聊SHA-3、SHA2变体SHA512_224\256等 2. SHA512-224\256 SHA512…

[oeasy]python0028_女性程序员_Eniac_girls_bug_Grace

028_第一个bug是谁发现的_编译之母 回忆上次内容 py文件 是 按照顺序 一行行 挨排 解释执行的 可以用 pdb3 hello.py 来调试程序 顺序执行 程序 在文本中 从上到下 是 一行行写的 解释器 从上到下 是 一行行解释的 调试 也是 从上到下 一行行 调试的 bug这个东西 是什么时候才有…

Rsync未授权访问漏洞

Rsync未授权访问漏洞 Rsync是Liux/Unix下的一个远程数据同步工具&#xff0c;可通过LAN/WAN快速同步多台主机间的文件和目录&#xff0c;默认运行在873端口。由于配置不当&#xff0c;导致任何人可未授权访问Syc,上传本地文件&#xff0c;下载服务器文件。RSyc默认允许匿名访问…

Java—继承和多态 (๑╹◡╹)ノ“““

目录&#xff1a; 一、继承&#xff1a; 为什么面向对象中有继承的概念&#xff1f;那么继承又是什么&#xff0c;继承又有什么作用呢&#xff1f;在我们生活中啊&#xff0c;也存在继承的关系&#xff0c;比如&#xff1a;你父母的财产由你“继承”。那在面向对象中&#xff…

vxe-pulldown 设置了宽度,并不能100%的占满整个容器的解决

1、下拉容器的使用 2、然而&#xff0c;这个宽度的显示是个问题&#xff0c;只占了一小部分&#xff1a; 长度并没有充满整个容器。 vxe-input设置了100%&#xff0c;然后也是一样的效果。 3、解决&#xff1a; .vxe-pulldown {width: 100% !important;} 增加上面的样式&…

本地GitLab runner自动编译Airoha项目

0 Preface/Foreword 1 GitLab runner环境 具体情况如下&#xff1a; Gitlab-ruuner运行在wsl 1中的Ubuntu 18.04 distro上专门为GitLab-runner分配了一个用户&#xff0c;名为gitlab-runner 2 自动编译 2.1 Permission denied 编译过程中&#xff0c;有两个文件出现权限不允…

Java语言程序设计基础篇_编程练习题*16.4 (创建一个英里/公里的转换器)

目录 *16.4 (创建一个英里/公里的转换器) 代码示例 结果展示 *16.4 (创建一个英里/公里的转换器) 编写一个程序来转换英里和公里&#xff0c;如图16-37b所示。如果在英里文本域Mile中输入一个值之后按下回车键&#xff0c;就会在公里文本域公里值。同样的&#xff0c;在公里文…

Latex入门指南:从下载到安装的全面教程

本篇博客旨在为初学者提供一个全面的Latex入门指南&#xff0c;涵盖了从下载、安装到配置Texlive和TexStudio的详细步骤。通过本指南&#xff0c;您将了解到如何正确安装Latex环境并成功运行第一个Latex文档&#xff0c;为撰写高质量的科技论文或书籍打下坚实基础。 目录 一定…

因为不懂ESLint,我被公司开除了……

你好,我是Qiuner. 为帮助别人少走弯路和记录自己编程学习过程而写博客 这是我的 github https://github.com/Qiuner ⭐️ ​ gitee https://gitee.com/Qiuner &#x1f339; 如果本篇文章帮到了你 不妨点个赞吧~ 我会很高兴的 &#x1f604; (^ ~ ^) 想看更多 那就点个关注吧 我…

把握现货黄金价格走势与买入时机 这两点缺一不可

在现货黄金投资中&#xff0c;对黄金价格走势的分析和做交易&#xff08;买入卖出&#xff09;&#xff0c;这些动作之间是相关联的&#xff0c;而且联系很大&#xff0c;比方说投资者如果没有对现货黄金价格走势做正确有效的分析&#xff0c;那他可能在一些交易中获得盈利&…

【附PDF】《大模型应用开发 动手做 AI Agent》,第一本给程序员看的AI Agent图书!

AI Agent火爆到什么程度&#xff1f; OpenAI创始人奥特曼预测&#xff0c;未来各行各业&#xff0c;每一个人都可以拥有一个AI Agent&#xff1b;比尔盖茨在2023年层预言&#xff1a;AI Agent将彻底改变人机交互方式&#xff0c;并颠覆整个软件行业&#xff1b;吴恩达教授在AI …

隧道通风网络节点图导出CAD文本时的三角形算法

在TESP软件中涉及到将带文本的节点图导出为CAD文件&#xff0c;其中文本的绘制需要根据Section的方向来确定&#xff0c;确保和绘图的习惯一致。具体包括&#xff1a; &#xff08;1&#xff09;垂直绘制的Section需确保文字字头向左。 &#xff08;2&#xff09;除了垂直的文…

Golang面试题三(map)

1.map底层实现 由图看出&#xff0c;其实map的底层结构体是hmap&#xff0c;同时hmap里面维护着若干个bucket数组&#xff08;即桶数组&#xff09;。bucket数组中每个元素都是bmap结构的&#xff0c;bmap中存储着8个key-value的键值对&#xff0c;如果是满了的话&#xff0c;当…