TensorFlow之分类模型-2

news2024/10/7 4:28:26

1 基本概念

2 文本分类与情感分析

获取数据集

加载数据集

训练数据集

性能设置

为了提升训练过程中数据处理的性能,keras技术框架提供数据集缓存的功能,使用缓存可以避免读取磁盘数据集时由于IO消耗太多而出现性能瓶颈的问题,如果数据集的容量太大,该缓存功能也可以将大量小文件对应的数据样本集中存储在磁盘形式的缓存中。

如上所示,prefetch方法提供将数据集预先加载到缓存中的功能,以上三个部分数据集分别对应训练数据集、验证数据集、测试数据集。

创建模型

如前所述,运行keras技术框架创建神经网络的多个处理层,然后,按照机器学习的层次将各层组装成一个神经网络。

如上所示,神经网络使用序列向量模型,嵌入向量层的维度是16,也就是,原文单词一个索引序列向量集的长度等于16,其描述如下所示:

 1 第一层是嵌入层,该层先对原文(电影评价的文本)进行数字编码,产生单词数字化序列,再对每一个索引序列元素计算一个嵌入向量集,则该层的输出的维信息是(batch, sequence, embedding),该维信息表示是(批次,单词数字化序列,序列的嵌入向量集)

 GlobalAveragePooling1D为每一个样本返回一个固定长度输出向量集,其处理方式是对每个样本所有的序列进行平均

 中间的隐藏层具有16个神经元的稠密层(全连接层)

 最后一层承接前一层的稠密层,收敛于一个处理单元

损失函数与优化器

一个模型需要一个损失函数与一个优化器用于训练,二元分类的损失函数是使用keras技术框架提供的losses.BinaryCrossentropy(二元交叉熵,在后续章节中详细描述)。

如上所示,优化器使用adam。

训练模型

使用模型的fit函数进行训练。

如上所示,进行10次迭代的训练,其中,train_ds是训练数据集,val_ds是验证数据集,二元分类的准确度不断地提升。

评估模型

模型训练完成之后,使用测试数据集对模型进行评估,评估过程输出损失值以及模型预测的准确度。

如上所示,损失值loss是损失函数的最小输出,损失越小则准确越高,accuracy是模型预测的准确度。

图表统计

以图表的方式展示损失与准确度在训练过程随着时间的变化,在前面的模型训练中,模型的fit函数返回一个训练历史记录。

如上所示,训练的历史记录的图表,loss表示训练数据集的损失值,binary_accuracy表示训练数据集二元分类的准确度,val_loss表示验证数据集的损失值,val_binary_accuracy表示验证数据集二元分类预测的准确度。

如上所示,使用训练数据集的损失值与验证数据集的损失值随着时间的变化展示在图形中,其中,横坐标epochs表示迭代训练的次数,纵坐标loss表示损失值,点号表示训练数据集损失值的变化,曲线表示验证数据集损失值的变化。

如上所示,使用训练数据集的准确度与验证数据集的准确度随着时间的变化展示在图形中,其中,横坐标epochs表示迭代训练的次数,纵坐标accuracy表示准确度,点号表示训练数据集准确度的变化,曲线表示验证数据集准确度的变化。

由以上的图表分析可知,每次迭代损失值变小,而准确度变高,其原因是在训练过程中使用梯度下降的算法对模型进行优化,在每次迭代中都最小化其损失值。

导出模型

模型测试完成,将模型导出,用于部署以及使用。

如上所示,导出模型、编译模型、评估模型。

预测示例

使用模型的predict方法对全新的数据进行预测。

如上所示,使用三个数据样本进行预测,第一个数据样本是正面评价、第二数据样本是正面评价、第三个数据样本是负面评价,三个数据样本的预测分数输出分别是0.6047846、0.42489105、0.3432073,其中,分数小于4是负面评价。

(未完待续)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/73554.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

操作系统的主要功能是什么

操作系统的主要功能是进程管理、存储管理、设备管理、文件管理、作业管理。 计算机系统的资源可分为设备资源和信息资源两大类。 操作系统位于底层硬件与用户之间,是两者沟通的桥梁。 1、进程管理,其工作主要是进程调度,在单用户单任务的情…

opcj2-盘点几个常见的Java开源脚手架

很多人抱怨自己是CURDer,很多时候就是在简单的修修改改。如果不书序SSM(Spring、SpringMVC和Mybatis)套路的人可能开始的时候会感觉非常吃力。但是熟悉之后发现其实就这么回事。SpringMVC负责响应对外接口,Mybatis负责数据库的访问…

TF4-圈子功能

TF4-圈子功能1、首页推荐1.1、接口分析1.2、功能实现1.2.1 controller1.2.2 service1.2.3 API接口1.2.4 请求dto对象2、MongoDB集群3、圈子功能2.1、功能说明1.2、实现方案分析1.3、技术方案(重点)1.4、表结构设计4、圈子实现3.1、环境搭建3.1.1、mongo主键自增3.1.2、实体类Mo…

基于matlab的SVM支持向量机分类仿真,核函数采用RBF函数

目录 1.算法描述 2.仿真效果预览 3.MATLAB核心程序 4.完整MATLAB 1.算法描述 支持向量机(support vector machines, SVM)是二分类算法,所谓二分类即把具有多个特性(属性)的数据分为两类,目前主流机器学…

如何清理 docker 磁盘空间 附讲解(全)

目录前言1. Docker System 命令1.1 docker system df1.2 docker system prune2. 冗余容器或镜像3. 限制容器日志前言 补充docker知识点,可看我之前的文章:Docker零基础从入门到精通(全) docker 镜像特别容易占空间,稍…

基于Redis实现高性能延时消息队列

最近在倒腾自建博客后端系统,需要用到延时任务的功能,但手头只有一套MySQL和Redis,如果搞一套MQ成本有点大,于是想着用redis实现延时消息队列。有些场景用数据库的定时扫表也能简单实现延时消息的功能,不过对于我这边的…

Bitmap,布隆过滤器初步了解

布隆过滤器使用教程 文章目录布隆过滤器使用教程1.背景2.什么是Bitmap3.布隆过滤器3.1 什么是布隆过滤器3.2 布隆过滤器的作用3.3 布隆过滤器的基本原理4.布隆过滤器的实现Guava和Redisson4.1 实现思路4.2 SpringBoot实现这些操作Bitmap,guava,redisson布隆过滤器1.背景 最近公…

redis知识点汇总

一、Redis的数据类型和数据结构 1、Redis五种数据类型 String(字符串)、List(列表)、Hash(哈希)、Set(集合)和Sorted Set(有序集合)。 2、Redis的底层数据…

C# 数据类型分值类型及引用类型

一 程序中的变量与常量 程序的基本任务是:对数据进行处理; 数据分为变量(variable)与常量(literal) int age18; 变量是值可以改变,本质上是内存的空间,用来存储信息 常量的值是固定的,直接写出来的,称字面…

点击按钮,下载文件

实现文件的下载功能 1、使用a标签 直接下载仅适用于浏览器无法识别的文件。 如果是浏览器支持的文件格式&#xff0c;如html、jpg、png、pdf等&#xff0c;则不会触发文件下载&#xff0c;而是直接被浏览器解析并展示 <ahref"http://xxxxxx.rar"download>下载…

vue中的性能优化

文章目录一、Vue为什么要做性能优化二、如何做vue的性能优化1. 网络请求优化link标签项目静态资源压缩懒加载利用浏览器的缓存机制高效复用项目文件总结2. 代码优化3. 用户体验优化场景1场景2一、Vue为什么要做性能优化 性能优化的目的是使网站的加载速度更快&#xff0c;用户…

【语音处理】基于自适应差分脉冲编码调制(ADPCM)的实现研究附Matlab代码

✅作者简介&#xff1a;热爱科研的Matlab仿真开发者&#xff0c;修心和技术同步进步&#xff0c;matlab项目目标合作可私信。 &#x1f34e;个人主页&#xff1a;Matlab科研工作室 &#x1f34a;个人信息&#xff1a;格物致知。 更多Matlab仿真内容点击&#x1f447; 智能优化算…

音视频直播系统之 WebRTC 中的协议UDP、TCP、RTP、RTCP详解

一、UDP/TCP 如果让你自己开发一套实时互动直播系统&#xff0c;在选择网络传输协议时&#xff0c;你会选择使用UDP协议还是TCP协议 假如使用 TCP 会怎样呢&#xff1f;在极端网络情况下&#xff0c;TCP 为了传输的可靠性&#xff0c;将会进行反复重发信息的操作 在 TCP 协议…

Nagios篇之Nagios服务关联飞书实现消息告警

一、前言 通常情况下&#xff0c;我们在利用Nagios监控来做服务器监控时&#xff0c;告警是必不可少的&#xff0c;以便于运维人员能够及时发现异常&#xff0c;进而处理问题&#xff0c;所以关联Nagios就变得极为重要。 Nagios关联告警的形式很多&#xff0c;可以进行短信推送…

wpf-ListView中放置可动态调节范围的刻度尺

需求描述 某个ListView占据整个窗口&#xff0c;当窗口的宽度发生改变时&#xff0c;某一列中显示的、某一行的字符数目&#xff0c;能跟随窗口宽度变化而增减。 下面是我做完的效果&#xff1a;&#xff08;只展示窗口的一部分&#xff09; 此时是窗口缩放的极限&#xff0…

为什么全光谱台灯对孩子眼睛好呢?台灯全光谱到底是什么意思

相信大家在购买台灯时有经常看到“全光谱”、“高显色”等关键词&#xff0c;其实这指的是台灯的某方面特性&#xff0c;所谓全光谱&#xff0c;就是指光线的光谱成分完全&#xff0c;与自然光别无二致。 我们都知道&#xff0c;一束自然太阳光不是由某个单一成分构成&#xff…

Briefings in Bioinformatics2021 | 药物挖掘分子设计--生成模型综述

原文标题&#xff1a;Molecular design in drug discovery: a comprehensive review of deep generative models 论文地址&#xff1a;Molecular design in drug discovery: a comprehensive review of deep generative models | Briefings in Bioinformatics | Oxford Academ…

35_DMA基本原理

目录 DMA简介 DMA框图 STM32的DMA有一下一些特征 DMA1控制器 DMA处理 数据方向 仲裁器 DMA通道 可编程的数据量 指针增量 循环模式 存储器到存储器模式 通道传输数据量 中断 通道配置过程 DMA简介 DMA全称Direct Memroy Access, 既直接存储器访问。 DMA传输将…

重编内核导致ubuntu有线连接不出现的问题

网卡是intel的i225v 千兆网卡&#xff0c;系统为ubuntu18.0.4&#xff0c;原始内核为5.4.0-135-generic&#xff0c;但是重新编译出错&#xff0c;不知道少了什么东西&#xff0c;也没去深究&#xff0c;重新下载了5.9.0的内核&#xff1b;结果重新编译内核重启有线网卡就不能用…

2.MyBatis环境搭建

数据准备 CREATE TABLE user (id int(11) NOT NULL,username varchar(30) NOT NULL,sex varchar(1) NOT NULL,birthday varchar(10) NOT NULL,address varchar(100) NOT NULL,PRIMARY KEY (id) ) ENGINEInnoDB DEFAULT CHARSETutf8;insert into user values(1,"steven&qu…