[高级人工智能 开放性调研] 近两年来[2022~2024]人工智能应用进展重要案例介绍

news2025/1/9 14:48:10

文章目录

  • [高级人工智能 开放性调研] 近两年来[2022-2024]人工智能应用进展重要案例介绍
    • 写在前面
    • 1. AIGC
      • 1.1 LLM | 大语言模型
        • 问答系统式的生成式AI
        • 文档解读——KimiChat
        • 代码生成——Cursor
      • 1.2 AI绘画\视频生成 | Stable Diffusion | OpenAI Sora
        • Stable Diffusion
        • OpenAI Sora
    • 2. 自动驾驶 | “萝卜快跑”(Apollo Go)商用
    • 相关链接

[高级人工智能 开放性调研] 近两年来[2022-2024]人工智能应用进展重要案例介绍

写在前面

  • 本文基于作者个人研究生就读阶段关于 《高级人工智能》 课程的开放性问题——“近两年来,人工智能在应用方面取得了哪些进展?请列举出有影响力的案例。” 展开信息收集并适当进行相关内容概述。
  • 本文会在作者个人整理的开放性进展的类别下举例一些作者个人用正在使用的感觉不错的AI应用,作为本文的拓展性价值——实用AI工具简介与推荐。
  • 本文不进行深入而具体的对某个具体实用的AI工具的详细叙述,仅展示作者个人更关注的近两年AI应用框架实用AI工具简介

1. AIGC

  • 我认为,AIGC是近两年来,人工智能在应用方面取得最明显进展,也是催生了众多有影响力,且真正在人们生产生活的各个方便提高了人们效率的垂直应用的重要案例领域

1.1 LLM | 大语言模型

问答系统式的生成式AI
  • 以ChatGPT为代表的大语言模型,可以称之为当之无愧的近两年来最具有影响力的人工智能应用进展的重要案例。

  • 2022 年 12 月,ChatGPT 第一次发布后,以问答系统应用为标志性特征的LLM的浪潮便席卷开来。
    在这里插入图片描述

  • 随着ChatGPT大语言模型的浪潮涌起后,国内也相继出现了包括,文心一言通义千问讯飞星火智谱清言等在内的大语言模型。这些都各自具备一定的可用性。
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

  • 这些LLM工具在不同的领域和应用中发挥着重要作用,从聊天机器人文本生成,再到数据翻译和分析等。

  • 技术细节: GPT也即是Generative Pre-trained Transformer,GPT的底层的技术细节是2017年出现的Transformer架构。2017 年,Google 在论文 Attention is All you need 中提出了 Transformer 模型,其使用 Self-Attention 结构取代了在 NLP 任务中常用的 RNN 网络结构。相比 RNN 网络结构,其最大的优点是可以并行计算
    请添加图片描述

文档解读——KimiChat
  • Kimi Chat 与其他大型语言模型(LLM)如文心一言相比,具有一些独特的优势:
  1. 处理长文本的能力:Kimi Chat 支持长达20万汉字的输入,这在全球市场中的产品化大模型服务中是非常突出的。这意味着它能够处理更长的上下文,为用户提供更深入的分析和回答。

  2. 文件处理能力:Kimi Chat 能够处理多种文件格式,包括PDF、Word文档、PPT幻灯片、Excel电子表格等,这为用户提供了极大的便利。
    在这里插入图片描述

  3. 搜索能力:Kimi Chat 具备搜索能力,可以结合实时搜索结果为用户提供回答,这使得它的答案更加准确和及时。
    在这里插入图片描述

  4. 垂直能力:Kimi Chat 拓展了许多具体有意义的场景应用,比如它提供了免费的PPT生成应用,改应用生成的PPT具有美观的PPT模板选择和充实丰富的内容填充。
    在这里插入图片描述

代码生成——Cursor
  • Cursor是一款基于GPT的代码生成工具,它可以帮助开发者快速生成代码,提高开发效率。GPT是一种自然语言处理技术,可以根据输入的文本生成相应的文本。Cursor利用GPT技术,将开发者的自然语言描述转化为代码,从而实现代码的快速生成。Cursor 是一款智能开发者编程工具,底层是由Chat-GPT3.5 or Chat-GPT4.0支持的,国内可以直接使用。
  • Cursor = VS code + ChatGPT
  • 相比于直接在网页中进行代码问答,Cursor能够允许开发者在类似VS code的IDE下进行chat,更适合LLM在代码开发的应用。
    在这里插入图片描述
  • Cursor可以让AI直接写代码:
    在这里插入图片描述
  • Cursor可以作为你的技术老师,帮你答疑解惑:
    在这里插入图片描述

1.2 AI绘画\视频生成 | Stable Diffusion | OpenAI Sora

Stable Diffusion
  • Stable Diffusion凭借其高度灵活性和通用性,能生成各类高质量图像,满足用户个性化需求。其领先的图像生成和风格转换能力,以及逼真的细节表现,使其在同类工具中脱颖而出。
  • Stable Diffusion 真正强大之处在于它可以根据文本提示生成图像。这是通过接受调节输入修改内部扩散模型来实现的。
  • 技术细节:从Diffusion ModelStable Diffusion
  • 纯扩散模型:
    图片非原创,来源见引用
  • 潜在扩散模型:
    在这里插入图片描述
OpenAI Sora
  • Sora是一个基于大规模训练的文本控制视频生成扩散模型。它能够生成长达 1 分钟的高清视频,涵盖广泛的视觉数据类型和分辨率。Sora通过在视频和图像的压缩潜在空间中训练,将其分解为时空位置补丁,实现了可扩展的视频生成。Sora还展现出一些模拟物理世界和数字世界的能力,如三维一致性和交互,揭示了继续扩大视频生成模型规模来发展高能力模拟器的前景。
  • Sora的重要意义在于它再次推动了AIGC在AI驱动内容创作方面的上限。在此之前,ChatGPT等文本类模型已经开始辅助内容创作,包括插图和画面的生成,甚至使用虚拟人制作短视频。而Sora则是一款专注于视频生成的大模型,通过输入文本或图片,以多种方式编辑视频,包括生成、连接和扩展,属于多模态大模型的范畴。这类模型在GPT等语言模型的基础上进行了延伸和拓展。
  • 技术细节: Sora主要通过三个步骤实现视频训练。首先是视频压缩网络,将视频或图片降维成紧凑而高效的形式。其次是时空补丁提取,将视图信息分解成更小的单元,每个单元都包含了视图中一部分的空间和时间信息,以便Sora在后续步骤中进行有针对性的处理。最后是视频生成,通过输入文本或图片进行解码加码,由Transformer模型(即ChatGPT基础转换器)决定如何将这些单元转换或组合,从而形成完整的视频内容。

在这里插入图片描述

2. 自动驾驶 | “萝卜快跑”(Apollo Go)商用

在这里插入图片描述

  • 2022年,萝卜快跑先后在深圳、北京、重庆、合肥、上海等地商业化运营,获准在京全无人测试。
  • 2023年:萝卜快跑累计订单超500万,武汉地区无人驾驶比例高,全国11城提供服务。
  • 2024年2月:萝卜快跑完成“万里长江第一跨”,武汉成首个智能网联汽车跨江城市。
  • 2024年5月:萝卜快跑发布Apollo ADFM大模型,投入千辆第六代无人车,成本降60%。
  • 技术细节:萝卜快跑由百度公司研发的自动驾驶技术驱动,涉及到的关键技术如下:
    这篇文章介绍了百度推出的无人驾驶出租车服务“萝卜快跑”(Apollo Go)的底层技术原理。以下是文章中提到的无人驾驶涉及的部分关键技术
  1. 感知系统:无人驾驶汽车通过多种传感器来感知周围环境,包括:

    • 激光雷达(LiDAR):生成高精度的三维地图。
    • 摄像头:捕捉道路标识、交通信号、行人和其他车辆。
    • 雷达(Radar):探测物体的速度和距离,适用于恶劣天气。
    • 超声波传感器:近距离探测,帮助避免低速时的碰撞。
  2. 决策与规划

    • 路径规划:基于地图和实时交通状况计算最优路线。
    • 行为预测:预测周围物体的运动轨迹,以做出安全决策。
    • 决策规划:生成具体的驾驶动作,如加速、刹车、转向等。
  3. 控制系统

    • 纵向控制:管理车辆的加速和减速。
    • 横向控制:管理车辆的转向。
    • 综合控制:协调纵向和横向控制,实现平稳驾驶。
  4. 人工智能与机器学习

    • 深度学习:用于图像识别、目标检测和分类。
    • 强化学习:优化决策和控制策略,通过模拟和实际驾驶数据训练。

相关链接

  • 文心一言
  • 通义千问
  • 讯飞星火
  • 智谱清言
  • Transformer 模型详解
  • kimichat
  • Cursor
  • Stable Diffusion 超详细讲解
  • 不了解Sora?看完这篇文章你就懂了
  • 视频生成Sora的全面解析:从AI绘画、ViT到ViViT、TECO、DiT、VDT、NaViT等
  • 萝卜快跑(Apollo Go)的 无人驾驶底层原理是什么,烧萝卜武汉实现了7*24小时的全天候运营,估计2025年实现盈利,2024年全国大部分城市部署萝卜快跑
  • 人工智能那么火~如今AI的应用场景都有哪些?

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2116177.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

模拟网络丢包常用方法以及工具

文章目录 背景常用方法代码实现使用方法测试代码 使用网络流量控制工具 常用工具Clumsy 背景 在软件开发过程中,经常需要模拟不同的网络环境来测试应用在不同条件下的表现。 这些模拟可以采用多种方式进行,包括在代码中实现随机丢包、随机延时、乱序&am…

《JavaEE进阶》----12.<SpringIOCDI【扫描路径+DI详解+经典面试题+总结】>

本篇博客主要讲解 扫描路径 DI详解:三种注入方式及优缺点 经典面试题 总结 五、环境扫描路径 虽然我们没有告诉Spring扫描路径是什么,但是有一些注解已经告诉Spring扫描路径是什么了 如启动类注解SpringBootApplication。 里面有一个注解是componentS…

【Leetcode152】乘积最大子数组(动态规划)

文章目录 一、题目二、思路三、代码 一、题目 二、思路 (0)读懂题意:题目的“连续”是指位置的连续,而不是说数字的连续,这是个大坑。 (1)确定状态:定义两个状态来记录当前子数组的…

Windows本地制作nginx证书

OpenSSL 是一个用于生成和管理 SSL/TLS 证书的工具。下载并安装 OpenSSL Select Additional Tasks页面勾选 The OpenSSL binaries (/bin) directory 将OpenSSL的bin目录配置到path中 开命令提示符(cmd)或 PowerShell。运行以下命令生成一个新的私钥和自…

哈希表的封装和位图

文章目录 2 封装2.1 基础框架2.2 迭代器(1)2.3 迭代器(2) 3. 位图3.1 问题引入3.2 左移和右移?3.3 位图的实现3.4 位图的题目3.5 位图的应用 2 封装 2.1 基础框架 文章 有了前面map和set封装的经验,容易写出下面的代码 // UnorderedSet.h #pragma on…

WireShark抓包软件介绍和安装

文章目录 一、WireShark软件介绍1. **概述**2. **主要功能**3. **使用场景**4. **安装和使用**5. **优点和限制**6. **结论** 二、WireShark的安装三、WireShark的基本使用1. **混杂模式(Promiscuous Mode)****概述****工作原理****应用场景****启用方式…

STM32F407VET6开发板RT-Thread memheap 内存堆的适配

相关文章 STM32F407VET6开发板RT-Thread的移植适配 STM32F407VET6开发板RT-Thread MSH 串口的适配 环境 STM32F407VET6 开发板(魔女),http://www.stm32er.com/ Keil MDK5,版本 5.36 memheap 内存堆 RT-Thread 支持 memheap …

数据结构基础讲解(二)——线性表之单链表专项练习

本文数据结构讲解参考书目: 通过网盘分享的文件:数据结构 C语言版.pdf 链接: https://pan.baidu.com/s/159y_QTbXqpMhNCNP_Fls9g?pwdze8e 提取码: ze8e 上一节我讲了线性表中顺序表的定义以及常用的算法,那么这节我将继续讲解顺序表中的链式…

MySQL-CRUD入门1

文章目录 认识配置文件client节点mysql节点mysqld节点 数据的添加(Create)添加一行数据添加多行数据两种添加数据的效率对比 数据的查询(Retrieve)全列查询指定列查询查询中带有表达式关于字面量关于as重命名 临时表引入distinct去重order by 排序关于NULL 认识配置文件 在我们…

数据结构基础详解(C语言): 树与二叉树的应用_哈夫曼树与哈夫曼曼编码_并查集_二叉排序树_平衡二叉树

文章目录 树与二叉树的应用1.哈夫曼树与哈夫曼曼编码1.1 带权路径长度1.2 哈夫曼树1.2.1 哈夫曼树的构造1.3 哈夫曼编码 2.并查集2.1 并查集的三要素2.1.1 并查集的逻辑结构2.1.2 并查集的存储结构 2.2 并查集的优化2.2.1 初步优化(并操作优化)2.2.2 终极…

flink wordcount

Maven配置pom文件 <?xml version"1.0" encoding"UTF-8"?> <project xmlns"http://maven.apache.org/POM/4.0.0"xmlns:xsi"http://www.w3.org/2001/XMLSchema-instance"xsi:schemaLocation"http://maven.apache.org/P…

mybatis-plus使用@EnumValue搭配shardingsphere报错“getObject with type”

目录 一、背景二、修改方案三、如何让修改的TypeHandler生效1、在TableField中配置TypeHandler2、考虑直接在TypeHandlerRegistry注册该枚举的handler为自定义的handler处理类。3、不止重写MybatisEnumTypeHandler&#xff0c;还重写CompositeEnumTypeHandler类3.1、修改Compos…

【WPF】桌面程序开发之xaml页面主题和样式详解

使用Visual Studio开发工具&#xff0c;我们可以编写在Windows系统上运行的桌面应用程序。其中&#xff0c;WPF&#xff08;Windows Presentation Foundation&#xff09;项目是一种常见的选择。然而&#xff0c;对于初学者来说&#xff0c;WPF项目中xaml页面的布局设计可能是一…

Bat的退役前

我们很讨厌bat 语法这版的命令形式后缀尽管古老&#xff0c;可是在涉及细微VS 项目op 时候&#xff0c;它起到了不可忽视且非它不行的效应 我们不想替历史背上厚重的学习包袱&#xff0c;可是我们能忽视BAT 吗 如若进入到 无window时代&#xff0c;我们几乎得全然依仗BAT专家。…

35天学习小结

距离上次纪念日&#xff0c;已经过去了35天咯 算算也有5周了&#xff0c;在这一个月里&#xff0c;收获的也挺多&#xff0c;在这个过程中认识的大佬也是越来越多了hh 学到的东西&#xff0c;其实也没有很多&#xff0c;这个暑假多多少少还是有遗憾的~ 第一周 学习了一些有…

【计算机组成原理】详细解读带符号整数的原码表示法

带符号整数的表示——原码 导读一、有符号整数的存储结构二、有符号整数的表现形式三、原码3.1 原码与真值之间的转换3.2 原码的运算3.3 原码的优缺点 结语 导读 大家好&#xff0c;很高兴又和大家见面啦&#xff01;&#xff01;&#xff01; 在上一篇内容中我们介绍了无符号…

828华为云征文|基于华为云Flexus云服务器X搭建jumpserver堡垒机软件

文章目录 ❀前言❀jumpserver堡垒机概述❀环境准备❀部署说明❀在线安装❀浏览器访问❀资产添加❀资产授权❀资产登录❀总结 ❀前言 近期华为云推出了最新的华为云Flexus云服务器X&#xff0c;这款云主机在算柔性算力做出了重大变革。华为云Flexus云服务器X基于擎天QingTian架…

Xilinx FPGA 原语解析(二):IBUFDS差分输入缓冲器(示例源码及仿真)

目录 前言&#xff1a; 一、原语使用说明 二、原语实例化代码模版 三、使用示例 1.设计文件代码 2.仿真文件代码 3.仿真结果 前言&#xff1a; 本文主要参考资料xilinx手册&#xff0c;《Xilinx 7 Series FPGA and Zynq-7000 All Programmable SoC Libraries Guide for…

LeetCode 热题 100 回顾1

干货分享&#xff0c;感谢您的阅读&#xff01;原文见&#xff1a;LeetCode 热题 100 回顾_力code热题100-CSDN博客 一、哈希部分 1.两数之和 &#xff08;简单&#xff09; 题目描述 给定一个整数数组 nums 和一个整数目标值 target&#xff0c;请你在该数组中找出 和为目标…

【Python 千题 —— 算法篇】词频统计

Python 千题持续更新中 …… 脑图地址 👉:⭐https://twilight-fanyi.gitee.io/mind-map/Python千题.html⭐ 题目背景 在日常开发和文本处理工作中,单词计数是一个非常基础但又极为重要的操作。无论是统计一篇文章的词频,还是分析一段文本的关键词,单词计数都起着关键作用…