生成式人工智能的第一课,揭开她那神奇的面纱

news2025/1/12 10:47:16

一、人工智能(Artificial Intelligence)

从1940年代开始,科学家们在数学推理的基础上发明了可编程数字计算机,这一突破激发了他们对创建“电子大脑”的探索热情,为后续的人工智能发展奠定了坚实的基础。1956年,由约翰·麦卡锡等人组织的达特茅斯会议,正式标志着人工智能作为独立研究领域的诞生,参会者预测机器将在一代人内达到人类智能的水平。然而,1974年至1980年间,由于Lighthill报告的批判,人工智能研究经历了第一次“AI寒冬”,资金和热度骤减,但逻辑编程和常识推理等新观念仍在不断涌现,为未来指明了新的方向。

到了1980年代,随着专家系统的发展,人工智能迎来了复兴期,取得了里程碑式的成就。1997年,IBM的深蓝击败了国际象棋冠军加里·卡斯帕罗夫,成为这一时期的标志性事件。同样在1986年,恩斯特·迪克曼斯发明了第一辆自动驾驶汽车,进一步展示了人工智能的潜力。进入2010年代,机器学习和深度学习的崛起使得人工智能技术迅猛发展,成为各类应用的核心。如今,AI系统不仅能生成富有创意的回应,处理大规模数据,还能完成过去被认为无法实现的任务,推动了智能客服等领域的革命性进步。

在人工智能中,“人工”一词源自英文单词“artificial”。在日常用语中,“artificial”意为合成的,往往带有负面意味,意味着“人造物体仅仅是真实物体的次要形式”。但实际上,人造物体常常优于真实或者自然物体。“智能”(intelligence)指的是个体从经验当中学习、进行正确推理、记住重要信息,以及应对日常生活需求的认知能力。

史蒂芬•卢奇在《Artificial Intelligence》中认为,人工智能是由人(people)、想法(idea)、方法(method)、机器(machine)和结果(outcome)等要素构成的。首先,构成人工智能的核心是人。人拥有想法,并将这些想法转化为方法。通过算法、启发式方法、程序或计算核心的系统,这些想法得以表达。最终,我们获取了这些机器(程序)所产生的产物,称之为“结果”。每一个结果都能够依据其价值、效果和效率进行衡量。

二、生成式人工智能(Generative AI)

生成式人工智能(Generative AI)是人工智能的一个子集,是一种能够根据用户提示创建新内容的人工智能技术,包括文本、图像、音频和视频等。这一能力通过复杂的机器学习模型,尤其是称为生成模型的深度学习模型来实现。这些模型从大量的训练数据中学习模式和结构,能够生成与输入数据具有相似特征的原创内容。

你可能已经在电子邮件或文本编辑器中的自动完成功能中遇到过其早期形式,自动完成以惊人的准确度预测你的句子结尾。这种变革性技术不仅仅是数据分析;它是在完全新的创造中注入生命,打破我们对机器所能实现的边界。静态、预编程响应的日子已经过去。生成式人工智能模型通过学习和适应,模仿人类观察、理解和创造的能力。这些模型通过分析大量的图像、文本、音频等数据集,破译定义每个领域的潜在模式和关系。凭借这些知识,它们不仅能模仿,还能超越模仿,生成完全新颖的内容,这些内容感觉新鲜、原创,并且常常与现实世界的内容非常相似。

生成式人工智能的应用范围广泛,涵盖了各个行业和领域。以下是一些典型应用:

1. 文本生成

生成式人工智能在文本生成领域表现尤为出色。通过大规模数据预训练,生成模型可以生成高质量的文本内容。

例如,文心大模型4.0在输入和输出阶段都进行知识点增强。一方面,对用户输入的问题进行理解,并拆解出回答问题所需的知识点,然后在搜索引擎、知识图谱、数据库中查找准确知识,最后把这些找到的知识组装进prompt送入大模型,准确率好,效率也高。另一方面,对大模型的输出进行反思,从生成结果中拆解出知识点,然后再利用搜索引擎、知识图谱、数据库,以及大模型本身进行确认,进而对有差错的点进行修正。

2. 图片生成

生成式人工智能在艺术和设计领域展现了巨大的创造力。通过学习大量的艺术作品和设计样式,生成模型可以创作出独特且富有创意的艺术作品。

Midjourney 是由位于美国加州旧金山的同名研究实验室开发的人工智能程序,由 Leap Motion 的创办人大卫·霍尔兹(David Holz)领导。它可以根据文本生成图像,于 2022 年 7 月 12 日进入公开测试阶段,用户通过 Discord 的机器人指令操作。其核心功能是把文本提示转换为图像,能生成涵盖建筑物、场景、艺术插画、写实照片和人物画等多种风格和主题的高质量图像。算法不断改进,相继发布了多个版本,第二版于 2022 年 4 月推出,第三版于 2022 年 7 月 25 日发布,第四版的 alpha 迭代版于 2022 年 11 月 5 日发布,第五版的 alpha 迭代版于 2023 年 3 月 15 日发布。

另外,Stable Diffusion是一个由Stability AI开发的文本到图像的深度学习模型,属于潜在扩散模型(Latent Diffusion Model, LDM)的一种变体。它能够根据用户提供的文本描述生成高质量的图像,广泛应用于艺术创作、设计和其他视觉内容生成领域。

3. 音乐创作

在音乐创作领域,生成式人工智能同样展现了惊人的潜力。通过学习大量的音乐数据,生成模型可以创作出风格多样的音乐作品。例如,Suno AI是一个生成式人工智能音乐创作平台,旨在让用户根据文本提示生成逼真的歌曲。自2023年12月20日上线以来,Suno已吸引了大量关注,以其创新的方法将音乐创作民主化,使从普通用户到专业艺术家都能轻松上手,无需任何乐器或深厚的音乐理论知识。

4. 视频生成

生成式AI视频生成是指利用人工智能算法创建视频内容的过程。这些系统可以从文本描述、图像或短视频剪辑等各种输入中生成视频。如Leonardo等工具可以将静态图像转换为短视频剪辑,用户可以调整运动强度等参数来自定义输出效果。Runway ML(Gen-2)等平台提供编辑现有视频或基于视频输入生成新内容的功能,可以延长剪辑、改变风格或向视频添加新元素等等。

Sora是一个能以文本描述生成视频的人工智能模型,由美国人工智能研究机构OpenAI开发。Sora这一名称源于日文“空”(そら sora),即天空之意,以示其无限的创造潜力。其技术基础是在OpenAI的文本到图像生成模型DALL-E上开发的。模型的训练数据既包含公开可用的视频,也包括专为训练目的而获授权的视频,但OpenAI没有公开训练数据的具体数量与确切来源。

OpenAI于2024年2月15日向公众展示了由Sora生成的多个高清视频,称该模型能够生成长达一分钟的视频。同时,OpenAI也承认了该技术的一些缺点,包括在模拟复杂物理现象方面的困难。《麻省理工科技评论》报道称演示视频令人印象深刻,但指出它们可能是经精心挑选的,并不一定能代表Sora生成视频的普遍水准。

上图为可灵大模型的官网截图,可灵大模型(Kling)是由快手大模型团队自研打造的视频生成大模型,具备强大的视频生成能力,感兴趣的伙伴可以申请试用。

​​​​​​​

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1959539.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

2024西安铁一中集训DAY23 ---- 模拟赛(类括号匹配dp + baka‘s trick 优化双指针 + 组合数学/高斯消元 + 图上性质题)

文章目录 前言时间安排及成绩题解A. 稻田灌溉(类括号匹配dp)B. 最长模区间(bakas trick 优化双指针)C. 三只小猪和狼(组合数学,高斯消元)D. 黑色连通块 前言 感觉是开始集训以来最难的一场了&a…

睿考网:中级会计师和注册会计师哪个难?

中级会计师和注册会计师两个资格证书对比下来,后者具有更高的挑战性,主要原因有以下几点: 1. 考试科目和内容: 注册会计师考试包含专业阶段与综合阶段,共涉及六个科目,考察的内容覆盖范围更广泛&#xff…

最新Yiso智云搜索引擎系统源码/开源PHP源码/修复版

源码简介: 最新Yiso智云搜索引擎系统源码/开源PHP源码/修复版。Yiso 是一个性能非常好的搜索引擎,不仅免费开源,还能当作收录网址的平台来用呢!只需要输入关键词,就能轻松找到相关的搜索结果内容。 1、Yiso 用的是自…

脚本: 监控Oracle数据库中正在运行的SQL(Oracle DBA的工作利器)

英文原文网址:[Script: Monitoring Running SQL in Oracle Database in Real Time] (https://byte-way.com/2024/07/24/script-monitoring-running-sql-in-oracle-database-in-real-time/) 以下SQL查询活动会话及其正在执行的SQL语句的信息,并提供有关其…

生成式AI 未来发展的两大要素:数据和开发者

这一年来,生成式 AI 领域的发展可谓日新月异。大语言模型 (LLM) 已经从学术研究圈的新宠,变成了开发者、产品经理、IT 决策者、高管等所有人都密切关注和亲身参与的重要课题。 一年间,这类问题在新闻报道、技术大会、开发者闲聊、同事讨论、…

【Dash】Hello World

一、最简单的 Dash Building and launching an app with Dash can be done with just 5 lines of code. Open a Python IDE on your computer, create an app.py file with the code below and install Dash if you havent done so already. To launch the app, type into yo…

DBeaver如何连接本地的mysql服务

要使用 DBeaver 连接本地的 MySQL 服务,可以按照以下步骤进行设置: 1. 下载和安装 DBeaver 首先确保已经下载并安装了 DBeaver。你可以从官方网站 DBeaver 官网 下载适用于 macOS 的安装包,并按照提示安装。 2. 打开 DBeaver 并添加新的数…

Python编程的思维导图

创建一个Python编程的思维导图是一个很好的方式来组织和理解Python编程的核心概念、语法、库和应用领域。下面是一个简化的Python编程思维导图的概要,可以根据需要进行扩展或修改: Python编程 ├── 基础概念 │ ├── 变量与数据类型 │ │…

基于 YOLO V10 Fine-Tuning 训练自定义的目标检测模型

一、YOLO V10 在本专栏的前面几篇文章中,我们使用 ultralytics 公司开源发布的 YOLO-V8 模型,分别 Fine-Tuning 实验了 目标检测、关键点检测、分类 任务,实验后发现效果都非常的不错,但它已经不是最强的了。最新的 YOLO-V10 已经…

如何看待储殷教授说的“现在的码农和纺织工人没区别“

储殷教授的观点认为现代的程序员(通常被称为“码农”)与过去的纺织工人没有本质的区别。这种说法引发了一些讨论和争议,码哥从几个角度来探讨这一观点: 工作性质的比较 重复性劳动 储殷教授可能认为,就像过去纺织工人…

18、基于DDD的微服务设计实例

在本章基于DDD的微服务设计实例中,我们将通过一个实际的微服务设计实例,详细介绍如何基于领域驱动设计(DDD)来构建微服务架构。这个实例不仅涵盖了微服务设计的基本原则,还展示了实际应用中的具体实现细节和最佳实践。…

pypi如何上传自己的代码记录

目录 一. 注册pypi账号并创建token 1. 注册pypi账号并创建token 2. Pypi账号注册 3. 邮箱验证 ​编辑 4. 重新生成恢复代码 5. 输入账号密码 ​编辑 6. 保存code并继续 ​编辑7. 输入一行即可,然后点击verify 8. 点击左方目录内的account setting&#xff…

17K star!30秒偷走你的声音,开源声音克隆工具

现在的AI发展越来越快,生成一段语音不是难事,那如果生成的是你自己的声音,你觉得如何? 今天我们分享一款开源的声音克隆工具,只需30秒的一般音源,他就可以偷走你的声音,它就是:Open…

【Vulnhub系列】Vulnhub_Seattle_003靶场渗透(原创)

【Vulnhub系列靶场】Vulnhub_Seattle_003靶场渗透 原文转载已经过授权 原文链接:Lusen的小窝 - 学无止尽,不进则退 (lusensec.github.io) 一、环境准备 1、从百度网盘下载对应靶机的.ova镜像 2、在VM中选择【打开】该.ova 3、选择存储路径&#xff0…

【扒代码】X = output[:,:,y1:y2,x1:x2].sum()

假设我们有以下输入: output 是一个形状为 (1【batch size】, 1【channel】, 10, 10) 的张量,表示一个 10x10 的输出图像。boxes 是一个形状为 (1【index】, 2, 5) 的张量,表示两个边界框,每个边界框包含 5 个值 [index, y1, x1,…

聊聊 ChatGPT

一、ChatGPT一次添加一个词 ChatGPT作用:人为输入任何文本后,自动生成一个"合理的延续",合理指的是:假如你看了数十亿网页上的内容后,发现大家都这么写,那你也这么写,就是合理的。Ch…

NC 删除有序链表中重复的元素-I

系列文章目录 文章目录 系列文章目录前言 前言 前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到网站,这篇文章男女通用,看懂了就去分享给你的码吧。 描述 删除给出链表…

代码随想录训练营 Day14打卡 二叉树 part02 226.翻转二叉树 101. 对称二叉树 104. 二叉树的最大深度 111. 二叉树的最小深度

代码随想录训练营 Day14打卡 二叉树 part02 一、 力扣226. 翻转二叉树 给你一棵二叉树的根节点 root ,翻转这棵二叉树,并返回其根节点。 示例 : 输入: root [4,2,7,1,3,6,9] 输出: [4,7,2,9,6,3,1] 我们下文以前序遍…

前端工程化-vue项目创建

可以使用html、css、javascpript ,以及使用vue、axios等技术搭建前端页面,但效率低、结构乱。 实际前端开发: 前端工程化开发步骤: 一、环境准备 1.安装NodeJS2. 安装vue-cli 二、创建Vue项目 有两种方式创建,一般采用第二种图…

【连续3年稳定发表,门槛低 易中稿】第四届先进制造技术与电子信息国际学术会议(AMTEI 2024,9月20-22)

由深圳技术大学集成电路与光电芯片学院、中南大学自动化学院联合支持的第四届先进制造技术与电子信息学术会议(AMTEI 2024)将于2024年09月20-22日在重庆召开。 本次会议主要围绕先进制造技术与电子信息的最新研究领域,为来自国内外高等院校、…