(python)小学出题热门词汇可视化绘制

news2024/11/16 1:30:52

1.代码

import pandas as pd  
from wordcloud import WordCloud  
import matplotlib.pyplot as plt  
from collections import Counter  
import jieba  # 如果你处理的是中文文本,需要jieba分词  
import re  
  
# 停用词列表,这里只是示例,你可以根据需要添加或修改  
stopwords = ['的', '是', '在', '了', '有', '和', '人', '我', '他', '她', '它', '们', '...','0','1','2','3','4','5','6','7','8','9','10','12','20','30']  
  
# 读取Excel文件  
df = pd.read_csv('word.csv', encoding='gbk')  
  
# 假设你的数据在名为'text'的列中  
texts = df['text'].tolist()  
  
# 数据清洗和分词  
cleaned_texts = []  
for text in texts:  
    # 去除标点符号和非中文字符  
    cleaned_text = re.sub(r'[^\u4e00-\u9fa5\w]', '', text)  
    # 使用jieba进行分词  
    words = jieba.cut(cleaned_text)  
    # 去除停用词  
    filtered_words = [word for word in words if word not in stopwords]  
    cleaned_texts.append(' '.join(filtered_words))  
  
# 生成词频字典  
word_freq = Counter()  
for text in cleaned_texts:  
    word_freq.update(text.split())  
  
# 绘制词云图  
wordcloud = WordCloud(font_path='simhei.ttf',  # 设置字体文件,确保能正确显示中文  
                      background_color='white',  
                      stopwords=None,  # WordCloud已经通过上面的步骤去除了停用词  
                      min_font_size=10).generate_from_frequencies(word_freq)  
  
plt.figure(figsize=(10, 10))  
plt.imshow(wordcloud, interpolation='bilinear')  
plt.axis('off')  
plt.show()

2.运行结果

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1861009.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

2024年【R2移动式压力容器充装】考试总结及R2移动式压力容器充装试题及解析

题库来源:安全生产模拟考试一点通公众号小程序 2024年【R2移动式压力容器充装】考试总结及R2移动式压力容器充装试题及解析,包含R2移动式压力容器充装考试总结答案和解析及R2移动式压力容器充装试题及解析练习。安全生产模拟考试一点通结合国家R2移动式…

PWN练习---Heap_1

heap_Easy_Uaf 题源:PolarD&N 考点:UAF漏洞(use after free) 源码 程序是一个菜单,可以实现add,dele,edit,puts 堆块内容等的功能。(堆块编号从0开始) 注意到一个存在backdoor的…

定制化服务:可燃气体报警器检定收费新模式

随着工业化和城市化的快速发展,可燃气体报警器作为重要的安全监测设备,其准确性和可靠性对于保障人们的生命财产安全至关重要。因此,可燃气体报警器的定期检定和维护显得尤为重要。 在这篇文章中,佰德将围绕可燃气体报警器检定收…

ssm 宠物领养系统-计算机毕业设计源码08465

目 录 摘要 1 绪论 1.1课题背景及意义 1.2研究现状 1.3ssm框架介绍 1.3论文结构与章节安排 2 宠物领养系统系统分析 2.1 可行性分析 2.2 系统流程分析 2.2.1 数据流程 3.3.2 业务流程 2.3 系统功能分析 2.3.1 功能性分析 2.3.2 非功能性分析 2.4 系统用例分析 …

Android Native 客户端属性配置系统使用说明

Android Native 客户端属性配置系统使用说明 背景和问题现代 android 开发基本都基于 gradle 属性设置来进行定制化编译,随着项目的迭代,工程结构越发复杂,配置属性越来越多,越来越多的配置使得上手难度越来越大。 解决方案设计一般而言,在 android 开发中,Gradle 属性系…

Calibre - 合并电子书(EpubMerge)

这里使用 Calibre 软件和 EpubMerge 插件 EpubMerge github : https://github.com/JimmXinu/EpubMerge 1、安装 Merge 插件 安装后需要重启 calibre 2、查看设置 4 3、选中文件、开始合并 合并完成后,会弹窗窗口,来编辑 合辑的元信息 完成…

学习记录697@数据通信基础之异步通信和同步通信

最近在看计算机网络物理层部分,涉及到异步通信和同步通信,这个和通信知识相关。 异步通信和同步通信都是为了解决时钟同步问题,这个和编程中的同步和异步是不一样的概念。 时钟同步 我的理解是,发送者发送一系列信号&#xff0…

Vue3 和 ECharts 创建交互式雷达图

本文由ScriptEcho平台提供技术支持 项目地址:传送门 Vue.js 中使用 ECharts 创建雷达图 应用场景 雷达图是一种多维数据可视化图表,常用于比较不同指标之间的关系和变化趋势。在 Vue.js 项目中,我们可以使用 ECharts 库轻松创建雷达图。 …

CPR曲面重建代码

废话不说,直接上代码: #include "vtkAutoInit.h" #include "vtkPolyData.h" #include "vtkProbeFilter.h" #include "vtkParametricFunctionSource.h" #include "vtkParametricSpline.h" #include &…

jenkins api部署时,一直提示pending-Finished waiting

问题: 调用jenkins api部署时,一直提示pending-Finished waiting 解决方案: 这个问题困扰了很久,一直没有思路,后面看到调用jenkinsAPI本身会出现一段提示,pending in the quiet period,通过搜…

智慧仓储的秘密武器:数据可视化的应用

智慧仓储中数据可视化是如何应用的?在现代物流和供应链管理中,智慧仓储已成为企业提升效率、降低成本和优化运营的重要手段。而数据可视化作为智慧仓储的重要工具,通过将复杂的数据转化为直观、易理解的图表和图形,极大地提升了仓…

js实现blockly后台解释器,可以单步执行,可以调用c/c++函数

实现原理 解析blockly语法树,使用js管理状态,实际使用lua执行,c/c++函数调用使用lua调用c/c++函数的能力 可以单行执行 已实现if功能 TODO for循环功能 函数功能 单步执行效果图 直接执行效果图 源代码 //0 暂停 1 单步执行 2 断点 //创建枚举 var AstStatus = {PAUS…

5、双足机器人mpc动力学模型

为计算机器人的当前实际状态x,需要建立双足质心动力学模型。 速度模型由控制输入变量推导速度公式: x向速度νx :当前机器人x方向的前进速度,初始值由速度传感器实时测量得到。y向速度νy :机器人y方向的平移速度。z向速度νz :垂直方向的速度,对于双足机器人行走时为0:…

吉利前端、AI面试

诸葛耘墒的在线视频面试 1、小程序端AI视频面试 虚拟人面试官提问 视频口述回答 1、最近的两份工作经历,以及上一份离职原因2、在过往的工作或生活中,需要学习掌握一项与工作有关的技能或兴趣爱好时,你会运用哪些方法和诀窍,投入…

项目实训-vue(十二)

项目实训-vue(十二) 文章目录 项目实训-vue(十二)1.概述2.处理进度可视化 1.概述 本篇博客将记录我在图片上传页面中的工作。 2.处理进度可视化 除了导航栏之外,我们还需要对上传图片以及图片处理的过程以及流程进行…

职业技能大赛引领下大数据专业实训教学的改革研究

随着信息化时代的加速发展,大数据专业作为新兴的热门领域,正日益成为高等职业教育体系中不可或缺的一部分,其承担着为社会培养大批具有高素质应用技能的大数据技术人才的重任。职业技能大赛作为检验和提升学生技能水平的有效平台,…

数据库中的事务、undo log、redo log、binlog都是干啥的?

文章目录 关于事务ACID 特性undo logredo logredo log 的写入过程事务的执行过程binlog细节总结 数据迁移数据备份工具innodb_autoinc_lock_mode 关于事务 事务(transaction)是作为一个单元的一组有序的数据库操作。如果组中的所有操作都成功&#xff0…

基于PHP+MySQL组合开发的在线客服小程序源码系统 带完整的安装代码包以及搭建教程

系统概述 源码系统是专门为满足企业在线客服需求而设计的,它集成了多种功能,能够帮助企业实现与用户的实时沟通、问题解答、信息反馈等。通过该系统,企业可以更好地了解用户需求,提升用户体验,增强用户对企业的信任感…

Clark 克拉克变换与克拉克逆变换

一、无刷电机控制原理 如上图所示,通过多个mos管的捷联去控制电机运动,即在电机的ABC三相中都会形成相应的电流变化,每相相差120。 二、Clark变换 但如果通过上面这种改变电流波形的方式去控制电机会变得非常复杂,则Clark变换是…

牛了,LSTM+Transformer王炸结合创新,荣登Nature,精度高达95.65%

【LSTM结合Transformer】的研究方向探索了如何利用Transformer模型处理序列数据的能力以及LSTM在捕捉时间序列依赖性方面的优势。这一方向的意义在于通过融合两种模型的特点,提高了对复杂时空数据的预测准确性,尤其是在智能电网攻击检测、多变量时间序列…