Keras生成式学习(五)

news2024/11/14 15:39:31

生成式深度学习

生成式学习即创造学习,深度学习开始创造

一、使用LSTM 生成文本

给定前面的标记(token,通常是单词或字符),能够对下一个标记的概率进行建模的任何网络都叫作语言模型(language model)。
语言模型能够捕捉到语言的潜在空间(latent space),即语言的统计结构,从模型的 softmax 输出中进行概率采样是一种很巧妙的方法。
在这里插入图片描述
举个例子,

输入从文本语料中提取的N个字符组成的字符串,然后训练模型来生成第N+1个字符

下载并解析初始文本文件

import keras
import numpy as np
path = keras.utils.get_file('nietzsche.txt',
	origin='https://s3.amazonaws.com/text-datasets/nietzsche.txt')
text = open(path).read().lower()
print('Corpus length:', len(text))

将字符序列向量化

maxlen = 60
step = 3
sentences = []
next_chars = []

for i in range(0, len(text) - maxlen, step):
	sentences.append(text[i: i + maxlen])
	next_chars.append(text[i + maxlen])
print('Number of sequences:', len(sentences))

chars = sorted(list(set(text)))
print('Unique characters:', len(chars))
char_indices = dict((char, chars.index(char)) for char in chars)
print('Vectorization...')

x = np.zeros((len(sentences), maxlen, len(chars)), dtype=np.bool)
y = np.zeros((len(sentences), len(chars)), dtype=np.bool)
for i, sentence in enumerate(sentences):
	for t, char in enumerate(sentence):
		x[i, t, char_indices[char]] = 1
	y[i, char_indices[next_chars[i]]] =

构建网络

from keras import layers
model = keras.models.Sequential()
model.add(layers.LSTM(128, input_shape=(maxlen, len(chars))))
model.add(layers.Dense(len(chars), activation='softmax'))
optimizer = keras.optimizers.RMSprop(lr=0.01)
model.compile(loss='categorical_crossentropy', optimizer=optimizer)
def sample(preds, temperature=1.0):
	preds = np.asarray(preds).astype('float64')
	preds = np.log(preds) / temperature
	exp_preds = np.exp(preds)
	preds = exp_preds / np.sum(exp_preds)
	probas = np.random.multinomial(1, preds, 1)
	return np.argmax(probas
	
import random
import sys
for epoch in range(1, 60):
	print('epoch', epoch)
	model.fit(x, y, batch_size=128, epochs=1)
	start_index = random.randint(0, len(text) - maxlen - 1)
	generated_text = text[start_index: start_index + maxlen]
	print('--- Generating with seed: "' + generated_text + '"')
	
for temperature in [0.2, 0.5, 1.0, 1.2]:
	print('------ temperature:', temperature)
	sys.stdout.write(generated_text)
	for i in range(400):
	sampled = np.zeros((1, maxlen, len(chars)))
	for t, char in enumerate(generated_text):
		sampled[0, t, char_indices[char]] = 1.
	preds = model.predict(sampled, verbose=0)[0]
	next_index = sample(preds, temperature)
	next_char = chars[next_index]
	generated_text += next_char
	generated_text = generated_text[1:]
	sys.stdout.write(next_char)

二、DeepDream 图像修改技术

DeepDream 的过程是反向运行一个卷积神经网络,基于网络学到的表示来生成输入。不局限于图像模型,甚至并不局限于卷积神经网络。它可以应用于语音、音乐等更多内容。

  • 使用 DeepDream,我们尝试将所有层的激活最大化,而不是将某一层的激活最大化,因 此需要同时将大量特征的可视化混合在一起。
  • 不是从空白的、略微带有噪声的输入开始,而是从现有的图像开始,因此所产生的效果 能够抓住已经存在的视觉模式,并以某种艺术性的方式将图像元素扭曲。
  • 输入图像是在不同的尺度上[叫作八度(octave)]进行处理的,这可以提高可视化的质量。 我们来生成一些 DeepDream 图像。

举个例子,
在这里插入图片描述

三、神经风格迁移

风格迁移是指创建一张新图像,保留目标图像的内容的同时还抓住了参考图像的风格。
在这里插入图片描述

  • 内容可以被卷积神经网络更靠顶部的层激活所捕捉到
  • 风格可以被卷积神经网络不同层激活的内部相互关系所捕捉到

因此,深度学习可以将风格迁移表述为一个最优化过程,并用到了一个用预训练卷积神经网络所定义的损失

四、用变分自编码器生成图像

用深度学习进行图像生成,就是通过对潜在空间进行学习来实现的,这个潜在空间能够捕捉到关于图像数据集的统计信息。通过对潜在空间中的点进行采样和解码,我们可以生成前所未见的图像。这种方法有两种重要工具:变分自编码器(VAE)和生成式对抗网络(GAN)。

  • VAE 得到的是高度结构化的、连续的潜在表示。因此,它在潜在空间中进行各种图像编辑的效果很好,比如换脸、将皱眉脸换成微笑脸等。它制作基于潜在空间的动画效果也很好,比如沿着潜在空间的一个横截面移动,从而以连续的方式显示从一张起始图像缓慢变化为不同图像的效果。
  • GAN 可以生成逼真的单幅图像,但得到的潜在空间可能没有良好的结构,也没有很好的连续性

五、生成式对抗网络简介

生成式对抗网络(GAN,generative adversarial network)由一个生成器网络和一个判别器网络组成。
判别器的训练目的是能够区分生成器的输出与来自训练集的真实图像,
生成器的训练目的是欺骗判别器。生成器从未直接见过训练集中的图像,它所知道的关于数据的信息都来自于判别器。

  • GAN 很难训练
    因为训练 GAN 是一个动态过程,而不是具有固定损失的简单梯度下降过程。想要正确地训练 GAN,需要使用一些启发式技巧,还需要大量的调节
  • GAN 可能会生成非常逼真的图像
    但与 VAE 不同,GAN 学习的潜在空间没有整齐的连续结构,因此可能不适用于某些实际应用,比如通过潜在空间概念向量进行图像编辑

参考文章&图书

《Python深度学习》

系列文章

Keras深度学习入门(一)
Keras计算机视觉(二)
Keras文本和序列(三)
Keras深度学习高级(四)
Keras生成式学习(五)

@ 学必求其心得,业必贵其专精

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/58031.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Android Camera性能分析 - 第25讲 CameraServer LatencyHistogram简介

本讲是Android Camera性能分析专题的第25讲 ​,我们介绍CameraServer LatencyHistogram简介,包括如下内容: LatencyHistogram是什么CameraServer默认有哪些Latency的Histogram如何获取CameraLatencyHistogram数据CameraLatencyHistogram类详…

Java项目:SSM CRM人事管理系统

作者主页:源码空间站2022 简介:Java领域优质创作者、Java项目、学习资料、技术互助 文末获取源码 项目介绍 CRM人事管理系统,主要功能有: 用户管理:用户查询、添加用户、编辑、删除; 职位管理&#xff1a…

Java基于springboot+vue的防护用品销售购物商城系统 前后端分离

开发背景 随着近些年疫情的爆发人们对个人医疗相关防护也越来越重视了,尤其是在疫情开始之初,人们对疫情感受到非常的恐慌,虽然在国家和领导人的领导下疫情一次次的得到了控制,但是我们还是要做好个人防护,为了让更多…

5、Linux文件系统

目录 1、万事万物皆文件 2、Linux二级文件目录 3、Linux的文件操作 4、读取文件信息 在Linux中万物皆文件 1、万事万物皆文件 1)在Linux中,所有的东西都是以文件的方式进行操作 2)在Linux中,文件的访问和Window的不一样。window依靠的是通过盘符进…

Tomcat经验2

背景 资产系统与财务系统对接,开发经常让我在数据库中执行数据库更新语句,并重启Tomcat,将log文件发给他,他能够根据log文件判断,数究竟有没有传对。 在这个过程中会出现一个问题: 部署在同一台Web服务器…

ORT(ONNX runtime)GPU 问题总结

现象 bt的堆栈信息 standard io上的错误输出 从报错信息上看是非法的内存访问,但是报错的位置不一定是真实的位置,因为GPU都是异步发起的,错误可能会被在后面的op捕捉。例如cudaEventDestory: debug方式 思维方式 复现&#…

Python中matplotlib为多个列表数据绘制小提琴图

本文介绍基于Python中matplotlib模块与seaborn模块,利用多个列表中的数据,绘制小提琴图(Violin Plot)的方法。 小提琴图作为一种将箱型图与核密度图分别所能表达的信息相结合的数据可视化图,在数据分析中得以广泛应用&…

【电动车】电动汽车两阶段优化调度策略(Matlab代码实现)

目录 1 概述 2 数学模型 3 运行结果 4 结论 4 Matlab代码实现 1 概述 在当前阶段,电动汽车通常被视为即插即充的常规负荷,这浪费了其可观的储荷能力"。研究表明,非快充需求的电动汽车停靠时间远大于其充电时间[2,因此可通过充电站管理电动汽车的充放 电功率,使电动…

数据分析必备的5个工具,你用过几个?

数据有了,但是怎么让它们“听话”且输出为好看的图表呢?相信这是每一个做数据的人都思考过的问题吧。我们在工作、学习中经常进行会借助一些表格或者图表来进行信息的展示,一般大家最常用的是Excel表格或者PPT,但是随着近些年物联…

震惊,一个csdn小编用Python语言写了一个足球游戏,成功模拟世界杯决赛现场

前言 halo,包子们下午好 最近世界杯不是很火呀 很多小伙伴应该都知道球赛反正买,别墅靠大海! 今天就给大家实现一个类似世界杯的足球小游戏,咱就说真的堪比国足了! 哈哈哈~ 好啦 直接开整!!&am…

39-65-javajvm-运行时数据区-pc-栈

39-javajvm-运行时数据区: 运行时数据区 内存是非常重要的系统资源,是硬盘和CPU的中间仓库及桥梁,承载着操作系统和应用程序的实时运行JVM内存布局规定了Java在运行过程中内存申请、分配、管理的策略,保证了JVM的高效稳定运行。不…

支付宝支付项目

文章目录🚏 支付宝支付项目🚀 支付宝介绍🚬 1、支付宝平台🚬 2、支付宝开放平台🚬 3、支付能力🚭 条码支付应用场景🚭 扫码支付应用场景🚭 App 支付🚭 手机网站支付&…

【CSS3】media,伪类与伪元素,outline,font-face,resize,svg,多列布局

❤️ Author: 老九 ☕️ 个人博客:老九的CSDN博客 🙏 个人名言:不可控之事 乐观面对 😍 系列专栏: 文章目录media例子resolution属性orientation属性aspect-ratio属性伪类与伪元素:target:disable/:enable:…

[附源码]计算机毕业设计校园生活服务平台Springboot程序

项目运行 环境配置: Jdk1.8 Tomcat7.0 Mysql HBuilderX(Webstorm也行) Eclispe(IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持)。 项目技术: SSM mybatis Maven Vue 等等组成,B/S模式 M…

【SQL教程|01】SQL简介——什么是SQL

什么是SQL SQL是一门语言 SQL是Structured Query Language的简写,中文译为“结构化查询语言”;SQL是一种用来查询和处理关系性数据库的语言,使用SQL我们可以: 增(INSERT):可以向数据库中插入记…

图神经网络关系抽取论文阅读笔记(六)

1 一个新颖的关系元组抽取级联二元标记框架(A Novel Cascade Binary Tagging Framework for Relational Triple Extraction) 1.1 引言 本文提出了关系三元组重叠的问题(一个sentence中有多个三元组,其中三元组中有的实体是同一个)。本文将其…

TTL反相器和CMOS

CMOS电路的动态特性: 1.传输延迟特性 在输入电压发生变化的时候,因为电容得存在,输出时间就得到了延迟 2.交流噪声容限 交流噪声容限是大于直流噪声容限 3.动态功耗 输入电压在二分之一,所以瞬间会流过很大的电流,会有瞬间很…

python练习题集锦之一

python练习题集锦之一 python练习题集锦之一,包括:1.限制输入的整数范围1到10之间、2.输出100以内素数(质数)及其和、3.求两个数最大公约数、最小公倍数 1.限制输入的整数范围1到10之间 源码如下: 提示 输入错误&…

时间复杂度(Time Complexity)

预计阅读时间:5分钟 一、简介 时间复杂度,又叫时间复杂性,也就是我们常说的大O。时间复杂度是不容忽视的衡量算法好坏的重要指标。 时间复杂度是一个函数,用于描述该算法的运行时间。 举个简单的例子:一个20米的木头&…

基于FPGA开发板使用Verilog设计PWM呼吸灯实验

基于FPGA开发板使用Verilog设计PWM呼吸灯实验 1,实验原理2,实验模块设计2.1 RTL设计,呼吸灯模块设计2.2,测试数据,下载到FPGA开发板板级的数据2.3,两个模块综合的netlist3,管脚约束4,FPGA开发板上的`led1` 灯上显示,一个复位键`key1`5,testbench6,前仿真,波形仿真验…