深度学习实战29-AIGC项目:利用GPT-2(CPU环境)进行文本续写与生成歌词任务

news2025/1/7 7:12:24

大家好,我是微学AI,今天给大家介绍一下深度学习实战29-AIGC项目:利用GPT-2(CPU环境)进行文本续写与生成歌词任务。在大家没有GPU算力的情况,大模型可能玩不动,推理速度慢,那么我们怎么才能跑去生成式的模型呢,我们可以试一下GPT-2完成一些简单的任务,让大家在CPU环境下也能进行生成式模型的推理。

一、GPT2模型

GPT-2是一种基于Transformer结构的大规模预训练语言模型,由OpenAI研发。Transformer模型之前讲过可以查看《深度学习实战24-人工智能(Pytorch)搭建transformer模型》。

GPT2它可以通过对大量文本数据进行预训练学习,然后针对不同任务进行微调,以实现更好的表现。GPT-2的预训练采用了无监督的方式,利用海量的文本数据构建语言模型。预训练过程中,输入的文本序列首先经过Token Embedding层和Positional Encoding层,然后输入到多个Transformer Decoder层中。每个Decoder层都由多头自注意力机制、前向神经网络和残差连接组成。在训练过程中,模型根据当前输入的文本序列来预测序列中下一个单词出现的概率分布,并根据损失函数进行优化,使得预测结果更加准确。

二、GPT-2的结构

GPT-2的结构主要由以下三部分组成:

1.Positional Encoding:为单词或字符的向量表示增加位置信息,以保证模型能够区分不同位置上的单词或字符。

2.Token Embedding:将每个单词或字符转换为对应的向量表示。

3.Transformer Decoder:由多个Encoder和Decoder层组成,其中Encoder层用于编码输入的文本序列,而Decoder层用于生成下一个单词的概率分布

                                      左:Trahformer模型; 右 : GPT Decoder Trahformer

三、GPT-2模型的特点

1.大规模预训练:GPT-2采用了海量的文本数据进行预训练,使得其在多个NLP任务上都表现出色。

2.自回归生成:GPT-2是一种自回归语言模型,可以根据前面已经生成的单词来生成后面的单词,从而生成连贯的文本内容。

3.多头注意力机制:GPT-2中使用了多头注意力机制,使得模型能够更好地捕捉输入序列之间的关系,提高了预测准确性。

四、GPT-2模型实现文本续写功能

from transformers import BertTokenizer, GPT2LMHeadModel, TextGenerationPipeline
tokenizer = BertTokenizer.from_pretrained("uer/gpt2-chinese-cluecorpussmall")
model = GPT2LMHeadModel.from_pretrained("uer/gpt2-chinese-cluecorpussmall")
text_generator = TextGenerationPipeline(model, tokenizer)

text = """会议主题:加快区块链技术创新附能实体经济 
近几年来,区块链技术与越来越多的实体行业深度融合"""
result = text_generator(text, max_length=500, do_sample=True)

res = result[0]['generated_text'].replace(text,'')

print(res.replace(' ',''))

生成结果:

。在中国,区块链拥有广泛的用户,很多客户希望能够以相同价格买到更多的产品。但是,区块链技术在中国一直被沿用至今,并且在逐渐取代了人们认为的现有产品。所以,对于一款商品来说,有一些问题尚且如此。此类问题的存在,使得人们对区块链的商业化和普及发展感到担忧。区块链能否成为未来全球交易市场中的一个新的方向?区块链技术能否改变商品交易中,消费者和机构之间的信息不对称、恶意盗窃和信用不良记录的现象,是否能够使这一市场重新开始?一切以商品来安全为前提,从这个角度上来说,这样的问题一直没有被解决。不过,无论如何,人们希望在价格、时间、地点等方面完成变革。在这个过程中,我们能够看到,以市场为标尺,以信息为动力的商品,以实体为主的金融体系,都在以价格为导向,以及价格的改变。而这个过程不仅仅是以市场为前提,而是一种精准定位系统,这包括我们的消费金融、智能硬件和互联网金融等相关服务的产品和服务。所以,区块链能否成为未来全球交易的新方向并不仅仅在于产品、服务和技术,而是在于通过区块链技术改变人们的消费行为。在大数据

五、GPT-2模型实现歌词续写功能

from transformers import BertTokenizer, GPT2LMHeadModel, TextGenerationPipeline
tokenizer = BertTokenizer.from_pretrained("uer/gpt2-chinese-lyric")
model = GPT2LMHeadModel.from_pretrained("uer/gpt2-chinese-lyric")
text_generator = TextGenerationPipeline(model, tokenizer)
text = "最美的不是下雨天,是曾与你躲过雨的屋檐"
result = text_generator(text, max_length=120, do_sample=True)
res = result[0]['generated_text'].replace(text,'')

print(res.replace(' ',''))

生成结果:

,那些被风吹散的缠绵,像是一个怀抱在怀间,我的爱情就像天边飞舞的流萤,在天下着一场一场的雨,是一种美丽的错觉是一种思念,我会把你慢慢的忘记,我会把你收藏在心底,让一切逝去不会再提起,就像在夜空里飞舞的

更多功能会持续更新!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/506839.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

14 KVM虚拟机配置-配置虚拟设备(其它常用设备)

文章目录 14 KVM虚拟机配置-配置虚拟设备(其它常用设备)14.1 概述14.2 元素介绍14.3 配置示例 14 KVM虚拟机配置-配置虚拟设备(其它常用设备) 14.1 概述 除存储设备、网络设备外,XML配置文件中还需要指定一些其他外部…

Python+selenium,轻松搭建 Web 自动化测试框架

在程序员的世界中,一切重复性的工作,都应该通过程序自动执行。「自动化测试」就是一个最好的例子。 随着互联网应用开发周期越来越短,迭代速度越来越快,只会点点点,不懂开发的手工测试,已经无法满足如今的…

云渲染靠谱吗,使用云渲染会不会被盗作品?

云渲染靠谱吗、安全吗?如果使用 云渲染会不会被盗作品......Renderbus瑞云渲染作为一个正经的云渲染平台,也时不时会收到这类疑问,首先,瑞云渲染是肯定靠谱的,各位可以放心使用。另外小编也将在本篇教你如何辨别云渲染平台是否安全…

通达信W底形态选股公式,也称双底形态

W底形态,也称双底形态,是一种经典的技术分析形态,代表了跌势的逆转。看起来像字母 "W",描述了一波下跌,反弹,再次下跌到与上一波下跌相同或相近的位置,最后是另一波反弹。W底形态两次…

【细读Spring Boot源码】@ComponentScan是如何生效的?

前言 在使用SpringBoot使用过程中 RestController、Service、Repository这几个注解类上都标有Component注解 启动类上标有的SpringBootApplication注解类上有个ComponentScan注解。那么ComponentScan如何把相关的对象注册到BeanFactory的? 找到处理ComponentScan注…

【Qt 从入门到入土】下篇

【Qt 从入门到入土】上篇 一个非常好的学习 Qt 的视频 本文目录 6. 对话框QDialog6.1 基本概念6.2 标准对话框6.3 自定义消息框6.4 消息对话框6.5 标准文件对话框 7. 布局管理器7.1 系统提供的布局控件7.2 利用widget做布局 8. 常用控件8.1 QLabel 控件使用8.2 QLineEdit8.3 其…

1_5 pytorch操作

一、torch 算子 1、torch.nn.functional.affine_grid(theta, size) 给定一组仿射矩阵(theta),生成一个2d的采样位置(流场),通常与 grid_sample() 结合使用,用于空间仿射变换网络,用于对2D或3D数据进行仿射变换。 输入:theta(Te…

5.20 牛奶咖啡·仙羽「重生」巡回演唱会 武汉站 告白夜浪漫收官

牛奶咖啡主唱仙羽「重生」主题巡回演唱会将于2023年5月20日浪漫收官。经历多次延期,「重生」巡回演唱会武汉站 终于与大家见面,届时会为大家带来多首传唱度极高的歌曲,与歌迷朋友共度一个难忘的告白夜。 关于仙羽仙羽(kiki&#…

微服务架构演变

微服务架构演变 认识微服务 服务架构演变 单体架构:将业务的所有功能集中在一个项目种开发,打成一个包部署 优点: 架构简单部署成本低 缺点: 耦合度高 分布式架构:根据业务功能对系统进行拆分,每个业…

python4delphi之初体验

最近需要做一个excel导入的工具, excel表格是python的强项,于是想delphi结合python实现 delphi环境xe2 python 3.6.6 上图可以看到,真的很爽,我在vscode写python脚本,然后给delphi调用 读取了一个excel文件,打印出了列头。 最爽的是,我在没wps,office环境的机…

【计算机视觉 | 目标检测】Grounding DINO 深度学习环境的配置(含案例)

“Grounding DINO:Marrying DINO with Grounded Pre-Training for Open-Set Object Detection”的官方 PyTorch 实现:SoTA 开放集对象检测器。 文章目录 一、Helpful Tutorial二、相关的论文工作2.1 相关的论文整理2.2 论文的亮点2.3 论文介绍2.4 Marryi…

shell脚本之数组与冒泡排序

目录 一. 数组1.1 数组定义:1.2 数组包括的数据类型:1.3 向函数传入数组的值 二. 冒泡排序算法 一. 数组 1.1 数组定义: 方法一: 数组名( 1 2 3 4 5 ) 方法二: 数组名( [0]1 [1]2 […

Nginx 概述和缓存能力

官方说明 理解说明 Nginx是一个高性能的Web服务器和反向代理服务器,其设计思想和执行机制可以概括如下: 异步事件驱动:Nginx采用基于事件驱动的异步I/O模型,这意味着它能够处理大量并发连接而不会消耗太多的系统资源。 单线程模…

(六)Kubernetes - 手动部署(二进制方式安装)

Kubernetes - 手动部署 [ 5 ] 1 部署NginxKeepalived高可用负载均衡器1.1 安装软件包(Master1/Master2)1.2 Nginx配置文件(主备相同)1.3 keepalived配置文件(Master1)1.4 keepalived配置(master2)1.5 Nginx增加Steam模块1.5.1 查看Nginx版本模块1.5.2 下载同一个版本的nginx1.5…

如何提高执行力

在最近的工作中很多事情容易拖延的,导致部分工作和自己的生活容易因为拖延导致混乱,比如没有提前预订好抢票,结果导致放假买不到票等等的事情出现。 所以很多事懒的原因是执行力差,为什么执行力差,说明事情不重要。那就…

DNS欺骗、ARP攻击及钓鱼网站制作

数据来源 本文仅用于信息安全的学习,请遵守相关法律法规,严禁用于非法途径。若观众因此作出任何危害网络安全的行为,后果自负,与本人无关。 一、背景 钓鱼者运用社会工程学( social engineering)知识诱骗受害者,以在…

buu [AFCTF2018]花开藏宝地 1

题目描述: 题面: 第80804238007977405688648566160504278593148666302626415149704905628622876270862865768337953835725801963142685182510812938072115996355782396318303927020705623120652014080032809421180400984242061592520733710243483947230…

Yolov8改进---注意力机制: SimAM(无参Attention)和NAM(基于标准化的注意力模块),效果秒杀CBAM、SE

🏆🏆🏆🏆🏆🏆Yolov8魔术师🏆🏆🏆🏆🏆🏆 ✨✨✨魔改网络、复现前沿论文,组合优化创新 🚀🚀🚀小目标、遮挡物、难样本性能提升 🍉🍉🍉定期更新不同数据集涨点情况 1. SimAM:无参Attention 论文: http://proceedings.mlr.press/v139/yang…

瑞云渲染农场怎么用,瑞云渲染多少钱一分钟?

Renderbus瑞云渲染农场作为亚洲前沿的 云渲染平台,一直以“做最好的云渲染工具”为愿景,紧跟CG行业的技术创新与发展,致力于提供专业可靠、安全稳定、可持续创新的云渲染解决方案,助力推动行业快速发展,被誉为中国云渲…

(6)——多窗口编程

目录 1. QMessageBox 消息对话框** 2. 窗口类继承关系** 3. QMainWindow 主窗口类** 3.1 QMenuBar 菜单栏 3.2 QToolBar 工具栏 3.3 QWidget 中心组件 3.4 QStatusBar 状态栏 4. parent参数** 5. 自定义窗口类** 6. 跨界面参数传递** 6.1 主窗口→子窗口 6.2 子窗口→主窗口 7…