基于电影评论数据的中文情感分析(含训练数据、验证数据) ,已实现NN(MLP)、CNN、LSTM方法

news2024/11/17 11:35:25

基于电影评论数据的中文情感分析(含训练数据、验证数据) ,已实现NN(MLP)、CNN、LSTM方法

完整代码下载地址:基于电影评论数据的中文情感分析(含训练数据、验证数据)

基于电影评论数据的中文情感分析

1).数据集
使用电影评论数据作为训练数据集. 其中, 训练数据集20000条(正负向各10000条); 测试数据集6000条(正负向各3000条)

2).数据预处理
1.去除停用词, 并使用jieba进行分词
2.使用预训练的词向量模型,对句子进行向量化

2. 各种实现方法准确率对比

AlgorithmAccuracy(avg)Accuracy(fasttext)Accuracy(matrix)说明
Naive-Bayes73.72%74.32%69.34%(拼接和补齐)/
Decision-Tree65.27%66.84%55.34%(拼接和补齐)/
KNN76.69%({‘n_neighbors’: 19})77.43%({‘n_neighbors’: 17})/(拼接和补齐)使用GridSearchCV进行参数选择
SVM79.29%({‘C’: 1000, ‘gamma’: 0.001, ‘kernel’: ‘rbf’})78.93%({‘C’: 1000, ‘kernel’: ‘linear’})/(拼接和补齐)使用GridSearchCV进行参数选择
NN(MLP)80.24%80.41%/采用EarlyStopping, ModelCheckpoint, ReduceLROnPlateau
CNN//81.34%采用EarlyStopping, ModelCheckpoint, ReduceLROnPlateau
LSTM78.76%77.26%84.06%采用EarlyStopping, ModelCheckpoint, ReduceLROnPlateau

3. 各种实现方法acc-loss曲线绘制

1).NN(MLP)实现方法结果绘制:
使用词向量和的平均表示句子:
在这里插入图片描述

使用fasttext.get_numpy_sentence_vector()词向量表示句子:
在这里插入图片描述

2).CNN实现方法结果绘制:
使用fasttext.get_numpy_vector()词向量组成的矩阵表示句子:
在这里插入图片描述

3).LSTM实现方法结果绘制:
使用词向量和的平均表示句子:
在这里插入图片描述

使用fasttext.get_numpy_sentence_vector()词向量表示句子:
在这里插入图片描述

使用fasttext.get_numpy_vector()词向量组成的矩阵表示句子:
在这里插入图片描述
完整代码下载地址:基于电影评论数据的中文情感分析(含训练数据、验证数据)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/128876.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

DaoCloud 结合 Karmada 打造新一代企业级多云平台

上周 Cloud Native Days China 南京站 Meetup 顺利举行,「DaoCloud 道客」大容器团队技术负责人-张潇在会上以《DaoCloud 结合 Karmada 打造新一代企业级多云平台》为主题,与 Karmada 社区及其合作伙伴一起,共同交流云原生多云多集群生产实践…

第04讲:在IDEA中使用Git

一、添加忽略的文件 第1步:创建git.ignore文件 windows系统在用户的家目录创建git.ignore文件(C:\Users[用户名]\git.ignore),复制如下代码到文件并保存 # Compiled class file *.class # Log file *.log # BlueJ files *.ctxt…

湘潭大学采购PZT-JH30/1压电薄膜PVDF极化装置

湘潭大学采购PZT-JH30/1压电薄膜PVDF极化装置 湘潭大学(Xiangtan University),简称“湘大”,位于湖南省湘潭市,是毛泽东同志亲自倡办的综合性全国重点大学、国家“双一流”建设高校,是湖南省人民政府与教育…

干货 | DC-DC芯片应用设计中的PCB Layout设计要点

在DC-DC芯片的应用设计中,PCB布板是否合理对于芯片能否表现出其最优性能有着至关重要的影响。不合理的PCB布板会造成芯片性能变差如线性度下降(包括输入线性度以及输出线性度)、带载能力下降、工作不稳定、EMI辐射增加、输出噪声增加等&#…

Eth05- Eth以太网发送函数代码解析

1 以太网帧的格式 了解发送函数之前先了解一下以太网帧的格式,以太网帧的格式如下所示: PREAMBLE–以太网帧以 7 字节前导码开头,指示帧的开始,并允许发送方和接收方建立位同步。最初,引入PRE(前导码)是为了允许由于信号延迟而损失几个位。但今天的高速以太网不需要前…

江苏大学采购GDPT-900A型高温精密压电D33测试仪

江苏大学采购GDPT-900A型高温精密压电D33测试仪 近日,江苏大学采购我们的ZJ-3型精密D33测试仪后,继而又采购了GDPT-900A型高温精密压电D33测试仪,该设备兼具高低温条件下,压电陶瓷材料的线性关系及其居里点温度的问题。对于研究极端条件下的压…

录屏软件录制内部声音,图文教程,快速解决

录屏软件是我们在使用电脑录屏的时候经常使用的工具。很多小伙伴在录制视频时,只想要录制内部声音,这该怎么解决呢?录屏软件录制内部声音,其实很简单,只需要简单的设置几步,就能解决,一起来看看…

UE4 SoundCue声音节点总结

最近撸了一下音效,做个总结Mark一下: 1.Cue文件:音频序列化文件,能够对多个音频文件进行排序、组合、淡入淡出等操作,做出新的音频文件 2.Cue文件中的“声音节点” 2.1按参数交叉淡化: 节点及参数详解&…

ObjectMapper的objectNode、ArrayNode各种转换使用

目录说明实例代码说明 本文章代码出自摸石头过河写出来的,隔天再写不一定写得出来,所以发个文章记录下。 为什么写这个代码 需求要求,有一段json字符串,数据结构是图下这样: {"id": "1","…

机器学习之特征工程详解

特征工程是指使用专业的背景知识和技巧处理数据,使得特征能在机器学习算法上发生更好的作用的过程。更好的特征意味着更强的灵活性,只需简单模型就能得到更好的结果,因此,特征工程在机器学习中占有相当重要的地位,可以…

pwr | 谁说样本量计算是个老大难问题!?(一)(分类变量篇)

1写在前面 估算前瞻性研究的样本量是我们在招募受试者之前首先要做的事情之一。😘 招募受试者太少会无法得到准确的答案,招募的太多又是巨大的浪费,所以需要估算最佳的受试者数量。🧐 本期我们介绍一下如何使用pwr包进行样本量的估…

Android性能优化——内存泄漏的根本原因

什么是内存泄露 什么是内存泄露,通俗的来说就是堆中的一些对象已经不会再被使用了,但垃圾收集器却无法将它们从内存中清除。 内存泄漏很严重的问题,因为它会阻塞内存资源并随着时间的推移降低系统性能。如果不进行有效的处理,最…

CS5518设计MIPI转LVDS转换方案/MIPI转LVDS方案芯片

CS5518是一个MIPI DSI输入,LVDS输出转换芯片。MIPI DSI最多支持4个车道,每个车道的最大运行速度 为1Gbps。LVDS支持18或24位像素,25MHz到154MHz,通过VESA或JEIDA格式。它只能使用一个1.8V电源,节省 成本,优…

Linux下的目录结构Linux基本命令(程序员必学)

目录 1.Linux下的目录结构 2.Linux的常用命令 2.1.# 与 $ 提示的区别 2.2.ifconfig 查看ip地址 2.3.su 命令格式 2.4.cd 2.5. 目录查看 2.6. 查看文件内容 2.7.创建目录及文件 2.8.复制和移动 2.9.其他 3. vim一般使用 1.Linux下的目录结构 /usr全称&#xff08…

Live Home 3D Pro - 用于公寓和房屋的室内设计,支持 3D 实时渲染

Live Home 3D Pro - 用于公寓和房屋的室内设计,支持 3D 实时渲染 Live Home 3D Pro是一个直观的应用程序,用于公寓和房屋的室内设计,以及几乎任何复杂的景观。专业版提供了一套扩展的工具和独特的出口质量。 下载 ► Live Home 3D Pro 下载安…

Java反射专题——基础知识一

反射 反射机制 java Reflection 反射机制允许程序在执行期借助于Reflection Api取得任何类的内部信息(比如成员变量,构造器,成员方法等等),并能操作对象的属性及方法。反射在设计模式和框架底层都会用到。加载完类之…

我眼中的代理模式

一.什么是代理模式? 举个简单的例子就是比如你相亲的女孩想跟你要个10W彩礼,但是她不好意思直接跟你说啊。这时候就媒婆就说我去跟小伙子说。有什么回应我告诉你。然后媒婆就先夸女方怎么怎么优秀,然后落到中心思想要钱。这里面相亲的女孩子就…

PL点亮LED灯

PL点亮LED灯 LED硬件 开发板在PL端给了一个LED灯,电压给低的时候才导通,才亮。然后需要看原理图确定具体是用的PL的哪个管脚以便进行控制。 Vivado 工程创建 打开创建新工程选择工程名和工程目录(不能有中文路径,也不能太长&…

什么品牌的蓝牙耳机音质最好?高品质蓝牙耳机排行榜

近年来,大量的蓝牙耳机品牌厂商涌入市场,蓝牙耳机的需求不断提高,但质量一直是人们担心的问题,今天就为大家盘点几款当前音质表现不错的真无线蓝牙耳机。 一、南卡小音舱蓝牙耳机 发声单元:13.3mm 网友推荐系数&…

hex文件格式剖析,以及hex与bin文件互相转换

大家好,我是学电子的小白白。 熟悉单片机开发的朋友,应该经常见到*.hex后缀的文件,它是单片机和嵌入式工程编译输出的一种常见的目标文件格式(比如keil就能编译输出hex文件),通过烧写工具把它下载到单片机…