wordcloud | 词云
- 🤨wordcloud | 词云
- 🫡词云是啥
- 😶🌫️词云的历史
- 🤔安装 wordcloud 包
- 😎官方文档
- 🤣一个最简单的例子
- 👍运行结果
- 😊感谢
🤨wordcloud | 词云
赢在起跑线上
🫡词云是啥
词云是关键词的视觉化描述,用于汇总用户生成的标签或一个网站的文字内容。标签一般是独立的词汇,常常按字母顺序排列,其重要程度又能通过改变字体大小或颜色来表现,所以标签云可以灵活地依照字序或热门程度来检索一个标签。 大多数标签本身就是超级链接,直接指向与标签相联的一系列条目
😶🌫️词云的历史
在标签云以权重表的形态出现之前,传统纸质地图早已使用不同大小或粗细的字体来表示城镇的相对面积或重要性。
在英文出版物里,标签云的概念首次以“潜意识文档”(subconscious files)的名字出现在1995年出版的道格拉斯·柯普兰(Douglas Coupland)的《微软信徒》(Microserfs)一书中。
照片分享社区Flickr是首个使用标签云的知名网站,其标签云由网站共同创立者、界面交互设计师斯图尔特·巴特菲尔德(Stewart Butterfield)设计创造,基于Jim Flanagan的Search Referral Zeitgeist,一个分析整理网站参考日志(HTTP referrer)的可视化应用实现。Del.icio.us和Technorati等网站也为标签云的普及起了推动作用。
2009年3月24日,CNN为当晚的安德森库珀360度(Anderson Cooper 360°)节目制作了一个声称是世界最大的文字云,文字云内容来源于当天奥巴马对新闻界发布的声明
🤔安装 wordcloud 包
pip install wordcloud
😎官方文档
简单的例子
wordcloud python in GitHub
🤣一个最简单的例子
入门来说够用了
#!/usr/bin/env python
"""
最简单的例子
===============
使用默认参数从编程语言生成一个方形词云
"""
import os
from os import path
from wordcloud import WordCloud
# 获取数据路径
# 在 IPython notebook 下则使用 getcwd()
d = path.dirname(__file__) if "__file__" in locals() else os.getcwd()
# 读取 constitution.txt 的文本
text = open(path.join(d, 'code_language.txt')).read()
# 生成一个词云图片
wordcloud = WordCloud().generate(text)
# 使用 matplotlib 展示生成图片
import matplotlib.pyplot as plt
plt.imshow(wordcloud, interpolation='bilinear')
plt.axis("off")
# 没有 matplotlib 也可以使用 pil 展示图片
# image = wordcloud.to_image()
# image.show()
code_language.txt
Java Java Java Java Java Java
Spring
SpringBoot
Mybatis
Oracle
MySQL
Python
C C++
JavaScript
CSS
HTML
👍运行结果
在 vscode 中展示词云结果
生成的图片
😊感谢
标签云 - 维基百科,自由的百科全书 (wikipedia.org)