python学习之10行代码制作炫酷的词云图(匹配指定图形形状)

news2024/9/20 20:27:53

文章目录

  • 前言
  • 一、需要准备什么?
  • 二、代码实现(示例)
  • 三、读入数据
  • 四、结果展示
  • 五、修改词云颜色后的运行结果展示:
  • 总结


前言

想必大家有一个问题:什么是词云呢?

词云又叫名字云,是对文本数据中出现频率较高的“关键词”在视觉上的突出呈现,形成关键词的渲染形成类似云一样的彩色图片,从而一眼就可以领略文本数据的主要表达意思。

网页上有许多词云的效果图:
在这里插入图片描述


一、需要准备什么?

python代码运行需要安装第三方模块pillow(PIL)、matplotlib、jieba、wordcloud 和numpy
如果安装库有遇到问题,可以参见下面的解决办法,在windows上测试可用。
python学习之报错:ModuleNotFoundError: No module named ‘pandas‘解决方法
python学习之数据分析和图表的应用(第一部分)报错:ModuleNotFoundError: No module named ‘wordcloud’

二、代码实现(示例)

代码如下(示例):

#导入matplotlib模块pyplot函数并使用as给函数起个别名plt
import matplotlib.pyplot as plt    
import jieba                       #导入jieba分词模块
import wordcloud                   #导入词云图模块
from wordcloud import ImageColorGenerator
import numpy as np                 #导入numpy模块
from PIL import Image              #从PIL模块中导入Image函数
# 读取文本文件
text = open('elsa.txt','r').read() #elsa.txt可以改成自己的文件
cut_text = jieba.cut(text)         #分词处理
word = ' '.join(cut_text)          #以空格分割文本
#读取图片
pic = np.array(Image.open('aa.png'))
image_colors = ImageColorGenerator(pic)  #生成图片颜色中的颜色
wd = wordcloud.WordCloud(
    mask=pic,                      #背景图形,如果根据图片绘制,则需要设置
    font_path='simhei.ttf',        #可以改成自己喜欢的字体
    background_color='white',      #词云图背景颜色可以换成自己喜欢的颜色
    )
wd.generate(word)                  #生成词云
# 图片颜色渲染词云图的颜色,用color_func指定
plt.imshow(wd.recolor(color_func=image_colors), interpolation='bilinear')
plt.axis('off')#关闭显示x轴、y轴下标
plt.show()

三、读入数据

下面咱们解析一下代码块:

1、导入了画图模块,词云生成模块和jieba的分词模块;

2、读取本地的文件,使用jieba进行分词,并对分词的结果以空格隔开;

3、读取指定图片图形文件,并显示字体、颜色等参数进行配置;

4、生成词云,并显示出来

这只是一个简单得不能再简单得编程,实现的效果也非常简单。这也是我喜欢python的一个原因吧,简洁明快。

但是Python是一门开源的语言,这时候就体现出开源的特性了,任何人都能对一个项目加以修改,使项目不断的完善。

Github上有许多开源的项目,有一个做词云的项目,大家可以去瞅瞅源码:

https://github.com/amueller/word_cloud

咱们可以直接进入wordcloud.py 源码进行字体,词云效果进行修改。

四、结果展示

在这里插入图片描述

在这里插入图片描述

五、修改词云颜色后的运行结果展示:

color_list=['black','red']
#多种颜色
'''color_list=['LightCoral','RosyBrown','IndianRed','Red','Brown','FireBrick'
            ,'DarkRed','Maroon','Gainsboro','LightGray'
            ,'Silver','DarkGray','Gray','DimGray','Black']'''
colormap=colors.ListedColormap(color_list) #matplotlib色图

在这里插入图片描述
在这里插入图片描述

总结

以上就是python词云生成的介绍了,源码中实现了词云生成的基本步骤,在参数设置方面,可以根据自己的需求设置不同的字体、形状和颜色,以及词云的大小。
有兴趣的小伙伴可以看看Github上有许多开源的项目,有一个做词云的项目,大家可以去瞅瞅源码:github地址
也可以直接进入wordcloud.py 源码进行字体,词云效果进行修改。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/359939.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

java调用elasticSearch api

java操作es有两种方式 通过操作es的9300端口,9300是tcp端口,集群节点之间通信也是通过9300端口,会通过9300和es建立一个长连接,下面的es的依赖可以直接操作 但是随着es的版本的提升spring-data需要封装不同版本的es的jar包&#x…

Windows命令大全

Windows命令大全命令简介运行流程CMD命令—文件管理CMD命令—磁盘管理CMD命令—系统管理CMD命令—进程管理CMD命令—控制台管理CMD命令—其他管理Windows运行工具操作示例命令简介 CMD命令是一种命令提示符,CMD是command的缩写,即命令提示符&#xff08…

QT(57)-QWT+VS2019+QT5.12.4环境配置-x86

1.下载QWT源码。 2.用VS2019-MSVC2019编译生成6个文件。 3.配置6个文件,把6个文件放对应的目录下。 4. 用自带的example检测配置环境。 1.下载QWT源码 Qwt Users Guide: Qwt - Qt Widgets for Technical Applications2.用VS2019-MSVC2019编译生成6个文件. #qw…

测试工程师如何提高自动化测试覆盖率

前言 自动化测试一直是测试人员的核心技能,也是测试的重要手段之一。尤其是在今年所谓的互联网寒冬的行情下,各大企业对测试人员的技术水平要求的很高,而测试人员的技术水平主要集中在三大自动化测试领域,再加测试辅助脚本的编写…

350-401-补充

补充 拖图 Cloud和On-Premise; Cloud: easy to scale the capacity up and down highly agile On-Premises: infrstructure requires large and regular investments highly customizable 云: 易于扩大和缩小容量 非常敏捷 本地: 基础设施…

nodejs基于vue 网上商城购物系统

可定制框架:ssm/Springboot/vue/python/PHP/小程序/安卓均可开发 目录 1 绪论 1 1.1课题背景 1 1.2课题研究现状 1 1.3初步设计方法与实施方案 2 1.4本文研究内容 2 2 系统开发环境 4 2. 3 系统分析 6 3.1系统可行性分析 6 3.1.1经济可行性 6 3.1.2技术可行性 6 3.1.3运行可行…

15 个杀手级 你可能从未听说过的 JS 技术

我们都同意,在 Google 或 StackOverflow 上搜索 Javascript 错误修复或答案并不有趣🏴‍☠️。这里有 20 种简短而强大的 JavaScript 技术,它们可以最大限度地提高生产力 ⚡ 并最大限度地减少痛苦 🩸。让我们深入研究代码&#x1…

人们最想看到的是:你在坚持什么?

【人们最想看到的是:你在坚持什么】 长远规划才能对抗不确定性 品牌也能够对抗不确定性 想想这么多年东搞搞,西搞搞 最后缺乏正向积累的【厚度】 趣讲大白话:把每滴水尽量接到碗里 人吃的是饭,拉出来的是信息 *********** 人们在频…

大数据周会-本周学习内容总结0102

目录 01、ElasticSearch-学习总结 02、SpringbootElasticSearch构建博客检索系统 01、将MySQL数据同步到ES中 02、SpringBoot集成ES 03、本周学习计划 第一次周会 大数据总监、搜狐四年-中国搜索 【mapReduce】sql 大数据代表:Hadoop、spark、es、flink zookee…

写给安徽合肥高三的你——少年不惧岁月长,敢挽桑弓射玉衡

文章目录说说我的看法英雄不论出处想帮帮你做科研,拼出个锦绣前程,朗朗乾坤!我能做的可能很少,可是全世界都会为你让路说说我的看法 在今日头条看到你, 仿佛看到了年轻时候自己的影子,虽然自己现在在读研已…

PHP面向对象02:面向对象高级

PHP面向对象02:面向对象高级一、设计模式1. 单例模式2. 工厂模式二、面向对象三大特性1. 封装2. 继承3. 多态三、继承1. 实现继承2. 有限继承a. 属性都能继承b. 公有方法c. 受保护的方法d. 静态成员3. 重写4. PHP继承特点5. 静态延迟绑定6. 最终类和最终方法7. 抽象…

真空度精密控制技术在液相透射电子显微镜液体厚度调节中的应用

摘要:为了实现液相电子显微镜的更广泛和更便捷应用,需要对微芯片中的液体样本厚度进行精密调控。本文基于透射显微镜中被检液体样本内外压差对应于液体厚度这一凸起变形膨胀的基本现象,提出了通过精确控制液体池内部真空度来实现液体厚度精密…

【大数据离线开发】7.4 HBase数据保存和过滤器

7.4 数据保存的过程 注意:数据的存储,都需要注意Region的分裂 HDFS:数据的平衡 ——> 数据的移动(拷贝)HBase:数据越来越多 ——> Region的分裂 ——> 数据的移动(拷贝) …

美国原装KEYSIGHT E4981A(安捷伦) E4981A电容计

KEYSIGHT E4981A(安捷伦) Keysight E4981A(安捷伦)电容计为生产线中的陶瓷电容器测试提供了高速、可靠的测量。E4981A 实现了电容从小到大的测量能力,测量准确。Agilent E4981A 电容计有助于提高测试吞吐量&#xff0…

Structure|Alphafold2在肽结构预测任务上的基准实验

​题目:Benchmarking AlphaFold2 on peptide structureprediction 文献来源:2023, Structure 31, 1–9 代码:基准实验,比较了比较多的模型 1.背景介绍 由2-50个氨基酸构成的聚合物可以称为肽。但是关于肽和蛋白质之间的差异还是…

树莓派4b系统安装

文章目录一.树莓派系统和工具下载二.树莓派系统烧录一.树莓派系统和工具下载 树莓派系统下载:https://www.raspberrypi.com/software/operating-systems/ 下载系统镜像写入工具:Win32DiskImager https://sourceforge.net/projects/win32diskimager/ …

仅作笔记用:Windows 10 继续使用 IE 浏览器(针对23年2月14日的系统更新)

2 月 14 日更新后有部分 Windows 10 的用户反映 IE 浏览器无法使用,打开后变成 Edge 浏览器。由于有少数业内业务仍然必须使用 IE 浏览器,这里稍微研究了一下解决方法。 打开 IE 浏览器的时候会出现“IE已经合并进Edge浏览器”的提示,此时千…

华为手表开发:WATCH 3 Pro(10)获取心率

华为手表开发:WATCH 3 Pro(10)获取心率初环境与设备文件夹:文件新增第二页面引用包 import sensor from system.sensor;showHeartbeat.hmlshowHeartbeat.js修改首页 -> 新建按钮 “ 跳转 ”index.hmlindex.js 引用包&#xff1…

JVM系统优化实践(1):JVM概览

您好,我是湘王,这是我的CSDN博客,欢迎您来,欢迎您再来~这是多年之前做过的学习笔记,今天再翻出来,觉得仍然是记忆犹新。「独乐乐不如众乐乐」,就拿出来分享给「众乐乐」吧。目前大多…

BCN科研试剂:1263166-91-1,endo BCN-O-PNB,ENDO BCN - 活性酯(P-NPC)

试剂基团反应特点:endo BCN-O-PNB中在有机溶剂中很容易与含胺分子发生反应,PNB 是一个很好的离去基团,BCN 用于无铜点击化学反应。结构式(Structural):基础产品数据:CAS号:1263166-9…