Python词云

news2025/1/19 8:19:49

词云图wordcloud

1.安装第三方库

j i e b a 库、 m a t p l o t l i b 、 w o r d c l o u d 库 jieba库、matplotlib、wordcloud库 jieba库、matplotlibwordcloud
民图灵机

2.过程

1.使用 j i e b a jieba jieba 库对数据进行分词整理,转为 t x t txt txt文件,转变为以空格分隔的词语字符串 s t r i n g string string
2.调用 w o r d c o l u d wordcolud wordcolud等函数绘制。

3.wordcloud的常用方法函数参数

参数:

1. f o n t _ p a t h : s t r i n g font\_path : string font_path:string : 字体路径,格式:字体路径+后缀名,
C : \ w i n d o w s \ F o n t \ w h i t e . t t f C:\backslash windows\backslash Font \backslash white.ttf C:\windows\Font\white.ttf
2. w i d t h : i n t ( d e f a u l t = 400 ) width : int(default=400) width:int(default=400) : 输出的画布宽度
3. h e i g h t : i n t ( d e f a u l t = 200 ) height : int (default =200) height:int(default=200) : 输出的画布高度
4. p r e f e r _ h o r i z o n t a l : f l o a t ( d e f a u l t = 0.90 ) prefer\_horizontal : float(default=0.90) prefer_horizontal:float(default=0.90) : 词语水平方向排版出现的频率,垂直方向做差。
5. s c a l e : f l o a t ( d e f a u l t = 1 ) scale : float(default=1) scale:float(default=1) : 按照比例放大画布,如设置 s c a l e = 2 scale=2 scale=2,则长宽都是原来的 2 2 2倍。
6. m i n _ f o n t _ s i z e : i n t ( d e f a u l t = 4 ) min\_font\_size : int(default=4) min_font_size:int(default=4) : 显示的最小字体的大小。
7. m a x _ w o r d s : i n t ( d e f a u l t = 200 ) max\_words : int(default=200) max_words:int(default=200) : 显示的词的最大个数。
8. b a c k g r o u n d _ c o l o r : ( d e f a u l t = ′ b l a c k ′ ) background\_color : (default='black') background_color:(default=black) :背景颜色。
9. m a x _ f o n t _ s i z e : i n t ( d e f a u l t = N o n e ) max\_font\_size : int(default=None) max_font_size:int(default=None) : 显示的最大字体的大小。
10. m a s k : n p . a r r a y 、 N o n e mask : np.array 、None mask:np.arrayNone :参数为空,默认词云形状为长方形。

函数:

1. g e n e r a t e _ f r o m _ t e x t ( t e x t ) generate\_from\_text(text) generate_from_text(text):根据文本生成词云。
2. g e n e r a t e ( t e x t ) generate(text) generate(text) : 根据文本生成词云。
3. g e n e r a t e _ f r o m _ f r e q u e n c i e s ( f r e q u e n c i e s [ , . . . ] ) generate\_from\_frequencies(frequencies[, ...]) generate_from_frequencies(frequencies[,...]) : 根据词频生成词云。
4. t o _ f i l e ( f i l e n a m e ) to\_file(filename) to_file(filename) : 输出到文件。

def generate(self, text):
    """Generate wordcloud from text.
    The input "text" is expected to be a natural text. If you pass a sorted
    list of words, words will appear in your output twice. To remove this
    duplication, set ``collocations=False``.
    Alias to generate_from_text.
    Calls process_text and generate_from_frequencies.
    Returns
    -------
    self
    """
    return self.generate_from_text(text)

def generate_from_text(self, text):
    """Generate wordcloud from text.
    The input "text" is expected to be a natural text. If you pass a sorted
    list of words, words will appear in your output twice. To remove this
    duplication, set ``collocations=False``.
    Calls process_text and generate_from_frequencies.
    ..versionchanged:: 1.2.2
        Argument of generate_from_frequencies() is not return of
        process_text() any more.

    Returns
    -------
    self
    """
    words = self.process_text(text)
    self.generate_from_frequencies(words)
    return self


调用过程:
g e n e r a t e ( s e l f , t e x t ) ⇒ s e l f . g e n e r a t e _ f r o m _ t e x t ( t e x t ) ⇒ w o r d = s e l f . p r o c e s s _ t e x t s e l f . g e n e r a t e _ f r o m _ t e x t ( w o r d ) generate(self, text) \Rightarrow self.generate\_from\_text(text) \Rightarrow \\word=self.process\_text \\ self.generate\_from\_text(word) generate(self,text)self.generate_from_text(text)word=self.process_textself.generate_from_text(word)

实例

在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/434959.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

AI和ML:数据中心的新前沿创新和优化

数据中心现在正在将人工智能(AI)和机器学习(ML)技术集成到其基础架构中,以保持竞争力。通过在传统数据中心架构中实施人工智能驱动层,企业可以创建自主数据中心,无需人工干预即可优化和执行通用数据工程任务。 随着对数据处理和存储的需求持续…

【行为型模式】策略模式

文章目录 1、简介2、结构3、实现方式3.1、案例引入3.2、结构分析3.3、具体实现 4、对比模板方法模式5、策略模式优缺点6、应用场景 1、简介 策略模式(Strategy)是一种设计模式,它允许在运行时根据需要选择算法的行为。这个模式将每个算法封装到一个类中&#xff0c…

Oracle VM VirtualBox安装开放麒麟桌面版本操作

1.环境 Oracle VM VirtualBox版本6.1.18 开放麒麟桌面版本openkylin 0.0.5 https://mirror.lzu.edu.cn/openkylin-cdimage/yangtze/openkylin-0.9.5-x86_64.iso 1.创建新虚拟电脑 ql 并将ios导入 然后点击启动 注意: vm box如果鼠标设置不当的话 基本上不可能完成…

PEIS源码 体检源码 医院体检系统源码

PEIS体检管理系统源码 PEIS源码 体检源码 医院体检系统源码 本套PEIS医院体检管理系统源码,采用C#语言开发,C/S架构,前台开发工具为Vs2012,后台数据库采用oracle大型数据库。有演示。 文末获取联系 PEIS体检管理系统适用于大中型…

鹅厂狂招工程师,国产自研芯片“沧海”斩获8项世界第一

前言 4月17日,腾讯云官方披露,在由莫斯科国立大学举办的最新一届MSU硬件视频编码比赛中,腾讯自研的编解码芯片“沧海”,经过数月的严格测试,获得了所参加的两个赛道8项评分的全部第一。 MSU为视频压缩领域最具影响力…

TensorFlow-GPU【易安装】(全网最全、通俗易懂、小白友好)

写在前面:CSDN的小伙伴们,很长时间没有发文了,自从靠运气侥幸考上研究生,就一直在苦苦寻找自己的研究方向。在跟风“随大流”之后,选择了深度学习这一领域,也是一场噩梦的开始! 为了更好的学习吴…

MySQL数据恢复-亲测有效版

MySQL数据恢复-亲测有效版 1.日志恢复的前提:1.1.登录远程MySQL服务器:1.2.查看binlog是否开启: 2.查看binlog存放日志文件目录:3.找到mysqlbinlog命令4.设置mysqlbinlog命令为全局可见5.使用mysqlbinlog解析binlog日志6.数据恢复…

信号频谱分析举例

以IQ解调不加滤波器的信号频谱进行分析 系统结构 IQ解调不加滤波器的系统结构框图为: 最后输出的基带复信号时域表达式为: s b b ( t ) s i ( t ) j s q ( t ) s ( t ) c o s ( ω c t ϕ ) − j s ( t ) s i n ( ω c t ϕ ) s_{bb}(t) s_i(t…

UDP报文结构解析

文章目录 UDP报文结构的讲解以及注意事项源端口和目的端口报文长度校验和 UDP报文结构的讲解以及注意事项 想要学习一个协议,我们就需要认识一下这个协议的报文格式,认识这个协议具体是如何组织数据的: 我们常见的UDP报文的格式图都是这样画…

体验编写Vue框架项目实例的详细步骤(包括git仓库使用)

一、查看项目设计图 二、确定项目开发技术栈 vue-cli3 element-ui axios vuex 三、页面布局 四、查看接口文档 五、开始开发 (五).搭建项目结构 1.创建项目 vue create godlike 创建项目的文章在:Vue自主搭建项目:Man…

Unity插件XCharts 图表

参考网址:Unity插件XCharts_xcharts unity_Raki_0的博客-CSDN博客 XCharts 下载地址 :Unity插件XCharts资源-CSDN文库 github 地址:Releases XCharts-Team/XCharts GitHub 一.导入教程 1.直接放入XCharts源码到项目 下载好XCharts源码…

Linux -- Web服务器 快速搭建静态网站,替换默认网页目录

快速搭建静态网站 : 先简单写个 页面 [rootserver ~]# echo " This is my first simple-Web " > /var/www/html/index.html 我们给网页写了一行内容 作为 静态网页的内容 ( 当然了,写的相当简单,您先理解着看&a…

【排序算法 上】带你手撕常见排序 (插入,希尔,选择,堆排序) (动图详解)

欢迎来到 Claffic 的博客 💞💞💞 “东风随春归,发我枝上花。” 前言: 排序是日常生活中极其常见的一种算法,它的功能很简单,就是将数字按照升序/降序排列,最终形成一组有序的数字&a…

Blender3.5 面的操作(一)

目录 1. 面操作1.1 细分面 Subdivide1.2 删除面1.3 挤出面 Extrude1.4 挤出流形1.5 内插面 Inset1.5.1 内插之后选择外侧1.5.2 选择多个面,同时内插操作1.5.3 选择多个面,同时内插选择外侧 1.6 外插1.7 尖分面 Poke Faces1.8 面三角化 Triangulate Faces…

【案例教程】R语言在气象、水文中数据处理及结果分析、绘图实践技术

语言是一门由统计学家开发的用于统计计算和作图的语言(a Statistic Language developed for Statistic by Statistician),由S语言发展而来,以统计分析功能见长。R软件是一款集成了数据操作、统计和可视化功能的优秀的开源软件。来…

分布式对象存储服务minio安装和部署

一、服务器安装minio 1.进行下载 下载地址: https://dl.min.io/server/minio/release/linux-amd64/minio2.新建minio安装目录,执行如下命令 mkdir -p /home/minio/data 把二进制文件上传到安装目录后,执行: chmod x minio //…

(leetcode)20. 有效的括号 13. 罗马数字转整数 14. 最长公共前缀

目录 20. 有效的括号 思路 代码 13. 罗马数字转整数 思路 代码 14. 最长公共前缀 思路 代码 20. 有效的括号 给定一个只包括 (,),{,},[,] 的字符串 s ,判断字符串是否有效。 有效字符串需满足&…

使用element-plus组件,修改date-picker默认样式

使用深度选择器来修改子组件的样式&#xff0c;今天遇到一个需求&#xff0c;在el-drawer中嵌入的el-date-picker&#xff0c;再一次总结一下深度选择器的用法&#xff0c;需求如下&#xff1a; template内容&#xff1a; <el-drawer size"70%" v-model"dr…

ZVL3网络分析仪

ZVL3 Rohde&Schwarz ZVL3 3G矢量网络分析仪|罗德与施瓦茨 9KHz至3GHz 罗德与施瓦茨Rohde&Schwarz 性能特点&#xff1a; 频率范围 9kHz至3GHz/6 GHz(典型值为5kHz) 测量时间(201个测量点&#xff0c;以校准的双端口) <75ms 数据传输(201个测量点) 在100Mbit/sLAN…

自主机器人概述

自主机器人概述 自主机器人自主机器人应用案例自主机器人相关实验室 自主机器人 自主机器人定义&#xff1a;自主机器人就是一个机器人可以在没有外界干扰的情况下&#xff0c;具备高自动化程度&#xff0c;可以执行任务的机器人。 自主机器人组成&#xff1a;感知-规划-控制…