Python 之 Matplotlib 柱状图(竖直柱状图和水平柱状图)、直方图和饼状图

news2024/11/16 16:31:30

文章目录

  • 一、柱状图
  • 二、竖直柱状图
    • 1. 基本的柱状图
    • 2. 同位置多柱状图
    • 3. 堆叠柱状图
  • 三、水平柱状图
    • 1. 基本的柱状图
    • 2. 同位置多柱状图
    • 3. 堆叠柱状图
  • 四、直方图 plt.hist()
    • 1. 返回值
    • 2. 添加折线直方图
    • 3. 不等距分组
    • 4. 多类型直方图
    • 5. 堆叠直方图
  • 五、饼状图 pie()
    • 1. 百分比显示 percentage
    • 2. 饼状图的分离
    • 3. 设置饼状图百分比和文本距离中心位置
    • 4. 图例

  • 在开始,我们先引入 matplotlib 和 numpy 库。
from matplotlib import pyplot as plt
import numpy as np
  • 对基本配置进行设置,将中文字体设置为黑体,不包含中文负号,分辨率为 100,图像显示大小设置为 (5,3)。
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False​
plt.rcParams['figure.dpi'] = 100​
plt.rcParams['figure.figsize'] = (5,3)

一、柱状图

  • 柱状图是一种用矩形柱来表示数据分类的图表。
  • 柱状图可以垂直绘制,也可以水平绘制。
  • 它的高度与其所表示的数值成正比关系。
  • 柱状图显示了不同类别之间的比较关系,图表的水平轴 X 指定被比较的类别,垂直轴 Y 则表示具体的类别值

在这里插入图片描述

二、竖直柱状图

matplotlib.pyplot.bar(x, height, width: float = 0.8, bottom = None, *, align: str = ‘center’, data = None, **kwargs)
  • 其参数具体如下含义:
  • x 表示 x 坐标,数据类型为 float 类型,一般是通过 np.arange() 生成的固定步长列表。
  • height 表示柱状图的高度,也就是 y 坐标值,数据类型为 float 类型,一般为一个列表,包含生成柱状图的所有 y 值。
  • width 表示柱状图的宽度,取值在 0~1 之间,默认值为 0.8。
  • bottom 表示柱状图的起始位置,也就是 y 轴的起始坐标,默认值为 None。
  • align 表示柱状图的中心位置,“center”,“lege” 边缘,默认值为 ’center’。
  • color 表示柱状图颜色,默认为蓝色。
  • alpha 表示透明度,取值在 0~1 之间,默认值为 1。
  • label 表示标签,设置后需要调用 plt.legend() 生成。
  • edgecolor 表示边框颜色 (ec)。
  • linewidth 表示边框宽度,浮点数或类数组,默认为 None (lw)。
  • tick_label 表示柱子的刻度标签,字符串或字符串列表,默认值为 None。
  • linestyle 表示线条样式 (ls)。

1. 基本的柱状图

  • 我们可以简单画一个柱状图用以观察,x 轴数据通过 range 函数生成,y 轴数据随便设定一个数组即可。
import matplotlib.pyplot as plt
x = range(5)
​data = [5, 20, 15, 25, 10]
​plt.title("基本柱状图")
plt.grid(ls="--", alpha=0.5)
plt.bar(x, data)

在这里插入图片描述

  • (1) bottom 参数。
  • bottom 参数表示的是柱状图的起始位置,也就是 y 轴的起始坐标,默认值为 None。
  • 我们仍采用和上述例子相同的数据,但与之不同的是,我们对 y 轴数据的起始点进行修改。
  • 这里需要注意的是,bottom 参数设定的数组与 y 轴数据的参数是一一对应的,而且,两个数组的形状要相同。
import matplotlib.pyplot as plt
x = range(5)
​data = [5, 20, 15, 25, 10]
​plt.title("基本柱状图")
​plt.grid(ls="--", alpha=0.5)
plt.bar(x, data, bottom=[10, 20, 5, 0, 10])

在这里插入图片描述

  • (2) 柱状图颜色。
  • 关于柱状图的颜色,我们也采用上述的数据进行操作,此时,不设置柱状图的 bottom 参数,同时,将柱状图的颜色设置为绿色。
import matplotlib.pyplot as plt
x = range(5)
data = [5, 20, 15, 25, 10]
​plt.title("设置柱状图颜色")
plt.grid(ls="--", alpha=0.5)
​plt.bar(x, data ,facecolor="green")
#plt.bar(x, data ,color="green")

在这里插入图片描述

  • 那么,在某些特定的情况下,柱状图的单一颜色并不利于我们后续的观察,因此,我们可以使用 facecolor 函数,分别对每个柱状图进行颜色的设置。
import matplotlib.pyplot as plt
x = range(5)
data = [5, 20, 15, 25, 10]
plt.title("color参数设置柱状图不同颜色")
plt.grid(ls="--", alpha=0.5)
plt.bar(x, data ,color=['r', 'g', 'b'])

在这里插入图片描述

  • (3) 柱状图描边。
  • 描边的相关的关键字参数为:
  • edgecolor 或 ec。
  • linestyle 或 ls。
  • linewidth 或 lw。
  • 具体可见如下具体实例。
import matplotlib.pyplot as plt​
data = [5, 20, 15, 25, 10]​
plt.title("设置边缘线条样式")​
plt.bar(range(len(data)), data, ec='r', ls='--', lw=2)

在这里插入图片描述

2. 同位置多柱状图

  • 在同一个 x 轴位置绘制多个柱状图,主要是通过调整柱状图的宽度和每个柱状图 x 轴的起始位置。
  • 例如,我们有 2022 年冬奥会挪威、德国、中国、美国和瑞典的金银铜牌数和总奖牌数。

在这里插入图片描述

  • 对此,我们需要绘制如下图形:

在这里插入图片描述

  • 对该柱状图进行分析,可得:
  • (1) 本实例需要对 x 轴进行计算,因此需要将 x 轴转数值。
  • (2) 确定同一 x 轴中,每个柱状图 x 轴的起始位置。
  • (3) 需要设置图形的宽度。
  • (4) 图形 2 的起始位置 = 图形 1 起始位置 + 图形的宽度。
  • (5) 图形 3 的起始位置 = 图形 1 起始位置 + 2 倍图形的宽度。
  • (6) 需要给每个柱状图循环显示文本内容。
  • (7) 需要显示图例。
  • 具体柱状图绘制过程如下:
  • 首先,我们需要导入国家和各个国家的金银铜奖牌数。
countries = ['挪威', '德国', '中国', '美国', '瑞典']
gold_medal = [16, 12, 9, 8, 8]
silver_medal = [8, 10, 4, 10, 5]
bronze_medal = [13, 5, 2, 7, 5]
  • 此时,如果我们直接进行绘制的话,会发现每个国家的奖牌柱状图发生了重叠,并且每个柱状图的宽度也过大。
  • 这是因为他们都默认 y 轴的起始坐标也就是 bottom 参数为 0,宽度参数由于没有设置,默认是 0.8。
plt.bar(countries, gold_medal,color="gold")
plt.bar(countries,silver_medal,color="silver")
plt.bar(countries,bronze_medal,color="red")

在这里插入图片描述

  • 针对上述在绘图过程当中出现的问题和最后结果的样图,我们需要将每个国家的金银铜牌柱状图分别画在一起,所以我们需要对 x 轴的国家参数进行坐标计算。
  • 由于字符串不可以直接进行算术运算,因此,我们使用 np.arange 将他们转化成数组,然后在返回字符串国家,并将柱状图的宽度 width 设置为 0.2
x = np.arange(len(countries))
print(x)
width = 0.2
#[0 1 2 3 4]
  • 随后,我们确定每个国家的金银铜牌柱状图的起始位置。
  • 金牌呃起始位置就是每个国家对应的 x 数值,银牌的起始位置就是每个国家对应的 x 数值再加上金牌柱状图的宽度,铜牌的起始位置与银牌相似,加上两倍的金牌位置即可(这里我们将每个柱状图的宽度均设置为 0.2)。
gold_x = x​
silver_x = x + width
​bronze_x = x + 2 * width
  • 在上述运行完成后,分别绘制图形即可。
plt.bar(gold_x,gold_medal,width=width,color="gold")
​plt.bar(silver_x,silver_medal,width=width,color="silver")
​plt.bar(bronze_x,bronze_medal,width=width, color="saddlebrown")

在这里插入图片描述

  • 此时,我们注意到,绘制柱状图的横坐标是数字还没有返回我们的国家参数。
  • 对此,我们需要将 x 轴的坐标变回来。
plt.xticks(x+width, labels=countries)

在这里插入图片描述

  • 最后,我们显示出每一个柱状图的高度参数和图例,就得到了我们需要的图像。
for i in range(len(countries)):
    plt.text(gold_x[i],gold_medal[i], gold_medal[i],va="bottom",ha="center",fontsize=8)
    plt.text(silver_x[i],silver_medal[i], gold_medal[i],va="bottom",ha="center",fontsize=8)
    plt.text(bronze_x[i],bronze_medal[i], gold_medal[i],va="bottom",ha="center",fontsize=8)  
plt.legend()

在这里插入图片描述

  • 代码汇总:
#库导入
from matplotlib import pyplot as plt
import numpy as np

#参数设置
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False
plt.rcParams['figure.dpi'] = 100
plt.rcParams['figure.figsize'] = (5,3)

#国家和奖牌数据导入
countries = ['挪威', '德国', '中国', '美国', '瑞典']
gold_medal = [16, 12, 9, 8, 8]
silver_medal = [8, 10, 4, 10, 5]
bronze_medal = [13, 5, 2, 7, 5]

#将横坐标国家转换为数值
x = np.arange(len(countries))
width = 0.2

#计算每一块的起始坐标
gold_x = x
silver_x = x + width
bronze_x = x + 2 * width

#绘图
plt.bar(gold_x,gold_medal,width=width,color="gold",label="金牌")
plt.bar(silver_x,silver_medal,width=width,color="silver",label="银牌")
plt.bar(bronze_x,bronze_medal,width=width, color="saddlebrown",label="铜牌")

#将横坐标数值转换为国家
plt.xticks(x + width,labels=countries)

#显示柱状图的高度文本
for i in range(len(countries)):
    plt.text(gold_x[i],gold_medal[i], gold_medal[i],va="bottom",ha="center",fontsize=8)
    plt.text(silver_x[i],silver_medal[i], gold_medal[i],va="bottom",ha="center",fontsize=8)
    plt.text(bronze_x[i],bronze_medal[i], gold_medal[i],va="bottom",ha="center",fontsize=8)  

#显示图例
plt.legend(loc="upper right") 
  • 其他知识点:在 Matplotlib 中旋转 X 轴刻度标签文本。
  • (1) plt.xticks(rotation= ) 旋转 Xticks 标签文本。
  • (2) fig.autofmt_xdate(rotation= ) 旋转 Xticks 标签文本。
  • (3) ax.set_xticklabels(xlabels, rotation= ) 旋转 Xticks 标签文本。
  • (4) plt.setp(ax.get_xticklabels(), rotation=) 旋转 Xticks 标签文本。
  • (5) ax.tick_params(axis=‘x’, labelrotation= ) 旋转 Xticks 标签文本。

3. 堆叠柱状图

  • 所谓堆叠柱状图就是将不同数组别的柱状图堆叠在一起,堆叠后的柱状图高度显示了两者相加的结果值。 如图:

在这里插入图片描述

  • 对该图进行分析可得:
  • (1) 金牌榜的起始高度为:铜牌数据+银牌数据。
  • (2) 银牌榜的起始高度为:银牌高度。
  • (3) 铜牌榜的起始高度为:0。
  • (4) 起始位置的数据相加需要使用 numpy 的相关知识。
  • (6) 需要确定柱状图的颜色。
  • (7) 显示图例。
  • 具体的绘制办法,跟上一个同位置多柱状图是完全类似的,区别在于我们需要注意 bottom 的数值计算,同时,金银铜牌的起始坐标是完全相同的。
#库导入
from matplotlib import pyplot as plt
import numpy as np

#参数设置
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False
plt.rcParams['figure.dpi'] = 100
plt.rcParams['figure.figsize'] = (5,3)

#国家和奖牌数据输入、柱状图宽度设置
countries = ['挪威', '德国', '中国', '美国', '瑞典']
gold_medal = np.array([16, 12, 9, 8, 8])
silver_medal = np.array([8, 10, 4, 10, 5])
bronze_medal = np.array([13, 5, 2, 7, 5])
​width = 0.3

#绘图
plt.bar(countries, gold_medal, color='gold', label='金牌',
        bottom=silver_medal + bronze_medal,width=width)
plt.bar(countries, silver_medal, color='silver', label='银牌', bottom=bronze_medal,width=width)
​plt.bar(countries, bronze_medal, color='#A0522D', label='铜牌',width=width)

#设置y轴标签,图例和文本值
​plt.ylabel('奖牌数')
​plt.legend(loc='upper right')for i in range(len(countries)):
    max_y = bronze_medal[i]+silver_medal[i]+gold_medal[i]
    plt.text(countries[i], max_y, max_y, va="bottom", ha="center")

在这里插入图片描述

三、水平柱状图

1. 基本的柱状图

  • 通过调用 Matplotlib 中的 barh() 函数可以生成水平柱状图。
  • barh() 函数的用法与 bar() 函数的用法基本一样,只是在调用 barh() 函数时使用 y 参数传入 y 轴数据,使用 width 参数传入代表条柱宽度的数据。
  • ha(horizontal alignment)控制文本的 x 位置参数表示文本边界框的左边,中间或右边。
  • va(vertical alignment)控制文本的 y位置参数表示文本边界框的底部,中心或顶部。
plt.barh(y, width, height=0.8, left=None, *, align='center', **kwargs)
  • 例如,我们以竖直柱状图当中的国家金牌数为例进行绘制。
countries = ['挪威', '德国', '中国', '美国', '瑞典']
gold_medal = np.array([16, 12, 9, 8, 8])
plt.barh(countries, width=gold_medal)

在这里插入图片描述

2. 同位置多柱状图

  • 在同一个 y 轴位置绘制多个柱状图,主要是通过调整柱状图的宽度和每个柱状图 y 轴的起始位置。
  • 例如,我们有最近三天当中 3 部电影的票房变化的数据。
movie = ['新蝙蝠侠', '狙击手', '奇迹笨小孩']
real_day1 = [4053, 2548, 1543]
real_day2 = [7840, 4013, 2421]
real_day3 = [8080, 3673, 1342]
  • 对此,我们需要绘制如下图像。
    在这里插入图片描述
  • 对该图进行分析可得:
  • (1) 由于牵扯高度的计算,因此先将 y 轴转换为数值型。
  • (2) 需要设置同图形的高度。
  • (3) 计算每个图形高度的起始位置。
  • (4) 绘制图形。
  • (5) 替换 y 轴数据。
  • 由于牵扯计算,因此将数据转 numpy 数组,水平的用位置多柱状图绘制方法与竖直的完全相同,在此便不过多叙述了。
#库导入
from matplotlib import pyplot as plt
import numpy as np

#参数设置
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False
plt.rcParams['figure.dpi'] = 100
plt.rcParams['figure.figsize'] = (5,3)

#数据的输入
movie = ['新蝙蝠侠', '狙击手', '奇迹笨小孩']
real_day1 = np.array( [4053, 2548, 1543])
​real_day2 = np.array([7840, 4013, 2421])
​real_day3 = np.array([8080, 3673, 1342])
​​
#y轴转换为数值型
num_y = np.arange(len(movie))#设置同图形的高度
height = 0.2#计算每个图形高度的起始位置
movie1_start_y = num_y              
movie2_start_y = num_y + height      
movie3_start_y = num_y + 2 * height  ​
​
#绘制图形​
plt.barh(movie1_start_y, real_day1, height=height)​
plt.barh(movie2_start_y, real_day2,  height=height)​
plt.barh(movie3_start_y, real_day3, height=height)# 计算宽度值和y轴值,替换y轴数据
​plt.yticks(num_y + height, movie)

在这里插入图片描述

3. 堆叠柱状图

  • 水平的堆叠柱状图与竖直的堆叠柱状图类似都是将不同数组别的柱状图堆叠在一起,堆叠后的柱状图高度显示了两者相加的结果值。 如图:

在这里插入图片描述

  • 对该图进行分析可得:
  • (1) 确定图形距离左侧的位置。
  • (2) 设置同一宽度。
  • (3) 绘制图形设置 left 参数。
  • (4) 标注数据。
  • 由于过程当中牵扯到计算,因此需要将数据转 numpy 数组。
  • 其他部分与绘制竖直堆叠柱状图的过程类似,在此便不过多进行叙述。
#库导入
from matplotlib import pyplot as plt
import numpy as np

#参数设置
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False
plt.rcParams['figure.dpi'] = 100
plt.rcParams['figure.figsize'] = (5,3)

#数据的输入
movie = ['新蝙蝠侠', '狙击手', '奇迹笨小孩']
real_day1 = np.array( [4053, 2548, 1543])
real_day2 = np.array([7840, 4013, 2421])
real_day3 = np.array([8080, 3673, 1342])#确定距离左侧​
left_day2 = real_day1​
left_day3 = real_day1 + real_day2 
​
# 设置线条高度
height = 0.2# 绘制图形:
plt.barh(movie, real_day1, height=height)​
plt.barh(movie, real_day2, left=left_day2, height=height) ​
plt.barh(movie, real_day3, left=left_day3, height=height)# 设置数值文本,计算宽度值和y轴为值​
sum_data = real_day1 + real_day2 +real_day3
for i in range(len(movie)):
    plt.text(sum_data[i], movie[i], sum_data[i],va="center" , ha="left")

在这里插入图片描述

四、直方图 plt.hist()

  • 直方图(Histogram),又称质量分布图,它是一种条形图的一种,由一系列高度不等的纵向线段来表示数据分布的情况。 直方图的横轴表示数据类型,纵轴表示分布情况。
  • 柱状图和直方图的区别:
  • 直方图用于概率分布,它显示了一组数值序列在给定的数值范围内出现的概率。
  • 柱状图则用于展示各个类别的频数。

在这里插入图片描述

柱状图直方图
柱状图一般用于描述离散型分类数据的对比直方图一般用于描述连续型数据的分布关系
每根柱子宽度固定,柱子之间会有间距每根柱子宽度可以不一样,且一般没有间距
横轴变量可以任意排序横轴变量有一定顺序规则
  • 将统计值的范围分段,即将整个值的范围分成一系列间隔,然后计算每个间隔中有多少值。 直方图也可以被归一化以显示相对频率。 然后,它显示了属于几个类别中的每个类别的占比,其高度总和等于 1。
  • 其语法模板如下:
plt.hist(x, bins=None, range=None, density=None, weights=None, cumulative=False, bottom=None, histtype='bar', align='mid', orientation='vertical', rwidth=None, log=False, color=None, label=None, stacked=False, normed=None, *, data=None, **kwargs)
  • 其参数具体如下含义:
  • x:作直方图所要用的数据,必须是一维数组;多维数组可以先进行扁平化再作图;必选参数。
  • bins:直方图的柱数,即要分的组数,默认为 10。
  • weights:与 x 形状相同的权重数组;将 x 中的每个元素乘以对应权重值再计数;如果 normed 或 density 取值为 True,则会对权重进行归一化处理。这个参数可用于绘制已合并的数据的直方图。
  • density:布尔,可选。如果为 True,返回元组的第一个元素将会将计数标准化以形成一个概率密度,也就是说,直方图下的面积(或积分)总和为 1。这是通过将计数除以数字的数量来实现的观察乘以箱子的宽度而不是除以总数数量的观察。如果叠加也是真实的,那么柱状图被规范化为 1(替代 normed)。
  • bottom:数组,标量值或 None;每个柱子底部相对于 y=0 的位置。如果是标量值,则每个柱子相对于 y=0 向上/向下的偏移量相同。如果是数组,则根据数组元素取值移动对应的柱子;即直方图上下便宜距离。
  • histtype:{‘bar’, ‘barstacked’, ‘step’, ‘stepfilled’};bar 是传统的条形直方图;barstacked 是堆叠的条形直方图;step 是未填充的条形直方图,只有外边框;stepfilled 是有填充的直方图;当 histtype 取值为 step 或 stepfilled,rwidth 设置失效,即不能指定柱子之间的间隔,默认连接在一起。
  • align:{‘left’, ‘mid’, ‘right’};left 是柱子的中心位于 bins 的左边缘;mid 是柱子位于 bins 左右边缘之间;right 是柱子的中心位于 bins 的右边缘。
  • color:具体颜色,数组(元素为颜色)或 None。
  • label:字符串(序列)或 None;有多个数据集时,用 label 参数做标注区分。
  • normed: 是否将得到的直方图向量归一化,即显示占比,默认为 0,不归一化;不推荐使用,建议改用 density 参数。
  • edgecolor: 直方图边框颜色。
  • alpha: 透明度。
  • 例如,我们可以使用 np.random.randint 随机生成 300 个在区间 [140,180](不包含 180)随机数据。
x_value = np.random.randint(140,180,300)
plt.hist(x_value, bins=10, edgecolor='white')
plt.title("数据统计")
plt.xlabel("身高")
plt.ylabel("比率")

在这里插入图片描述

1. 返回值

  • n:数组或数组列表,返回直方图的值。
  • bins:数组,返回各个 bin 的区间范围。
  • patches:列表的列表或列表,返回每个 bin 里面包含的数据,是一个 list。
  • 以上个例子进行试验,分别对 num,bins 和 patches 的返回值进行观察。
num
#array([25., 28., 34., 39., 29., 25., 37., 34., 26., 23.])

bins_limit
#array([140. , 143.9, 147.8, 151.7, 155.6, 159.5, 163.4, 167.3, 171.2,
#       175.1, 179. ])

for i in patches:
    print(i)
    print(i.get_x())
    print(i.get_y())
    print(i.get_height())
    print(i.get_width())

在这里插入图片描述

patches[0].get_width()
#3.9000000000000057
  • 知识点补充:
  • xy:xy 位置(x 取值 bins_limits 是分组时的分隔值,y 取值都是 0 开始)。
  • width:宽度为各个 bin 的区间范围(bins_limits 是分组时的分隔值)。
  • height:高度也就是密度值(n 是分组区间对应的频率)。
  • angle:角度。
  • 以最开始的直方图为例,进行上述参数的观察。

在这里插入图片描述

2. 添加折线直方图

  • 在直方图中,我们也可以加一个折线图,辅助我们查看数据变化情况。
  • 首先通过 pyplot.subplots() 创建 Axes 对象。
  • 通过 Axes 对象调用 hist() 方法绘制直方图,返回折线图所需要的下 x,y 数据。
  • 然后 Axes 对象调用 plot() 绘制折线图。
  • 我们对前面的代码进行修改即可。
#创建一个画布
fig, ax = plt.subplots()# 绘制直方图
num,bins_limit,patches = ax.hist(x_value, bins=10, edgecolor='white')# 注意num返回的个数是10,bins_limit返回的个数为11,需要截取
print(bins_limit[:-1])

# 曲线图
ax.plot(bins_limit[:10], num, '--',marker="o")
plt.xticks(bins_limit,rotation=45)

在这里插入图片描述

3. 不等距分组

  • 面的直方图都是等距的,但有时我们需要得到不等距的直方图,这个时候只需要确定分组上下限,并指定 histtype=“bar” 就可以。
fig, ax = plt.subplots()
x = np.random.normal(100,20,100)
bins = [50, 60, 70, 90, 100,110, 140, 150]
ax.hist(x, bins, color="g",rwidth=0.5)
ax.set_title('不等距分组')
plt.show()

在这里插入图片描述

4. 多类型直方图

  • 我们在使用直方图查查看数据的频率时,有时候会查看多种类型数据出现的频率。
  • 这时候我们可以以列表的形式传入多种数据给 hist() 方法的 x 数据。
  • 我们指定 10 个分组个数,每组有 ABC 三类,分别生成 10000,5000,2000 个值,实际绘图代码与单类型直方图差异不大,只是增加了一个图例项,在 ax.hist 函数中先指定图例 label 名称。
n_bins=10
​fig,ax=plt.subplots(figsize=(8,5))
​x_multi = [np.random.randn(n) for n in [10000, 5000, 2000]]
​ax.hist(x_multi, n_bins, histtype='bar',label=list("ABC"))
​ax.set_title('多类型直方图')
​ax.legend()

在这里插入图片描述

5. 堆叠直方图

  • 我们有时候会对吧同样数据范围情况下,对比两组不同对象群体收集的数据差异。
  • 对此,我们准备两组数据:
x_value = np.random.randint(140,180,200)
x2_value = np.random.randint(140,180,200)
  • 直方图属性 data:以列表的形式传入两组数据。
  • 设置直方图 stacked:为 True,允许数据覆盖。
plt.hist([x_value,x2_value],bins=10, stacked=True)
#([array([16., 23., 27., 22., 13., 22., 18., 21., 18., 20.]),
#  array([39., 46., 44., 35., 33., 47., 41., 42., 33., 40.])],
# array([140. , 143.9, 147.8, 151.7, 155.6, 159.5, 163.4, 167.3, 171.2,
#        175.1, 179. ]),

在这里插入图片描述

五、饼状图 pie()

  • 饼状图用来显示一个数据系列,具体来说,饼状图显示一个数据系列中各项目的占项目总和的百分比。
  • Matplotlib 提供了一个 pie() 函数,该函数可以生成数组中数据的饼状图。您可使用 x/sum(x) 来计算各个扇形区域占饼图总和的百分比。
  • pie() 函数的语法模板如下:
pyplot.pie(x, explode=None, labels=None, colors=None, autopct=None)
  • pie() 函数的参数说明如下:
  • x:数组序列,数组元素对应扇形区域的数量大小。
  • labels:列表字符串序列,为每个扇形区域备注一个标签名字。
  • colors:为每个扇形区域设置颜色,默认按照颜色周期自动设置。
  • autopct:格式化字符串 “fmt%pct”,使用百分比的格式设置每个扇形区的标签,并将其放置在扇形区内。
  • pctdistance:设置百分比标签与圆心的距离。
  • labeldistance:设置各扇形标签(图例)与圆心的距离。
  • explode:指定饼图某些部分的突出显示,即呈现爆炸式。
  • shadow:是否添加饼图的阴影效果。

在这里插入图片描述

  • 例如,我们将大小设置为 (5,5),定义饼的标签,每个标签所占的数量,绘制饼图。
plt.rcParams['figure.figsize'] = (5,5)
labels = ['娱乐','育儿','饮食','房贷','交通','其它']
​x = [200,500,1200,7000,200,900]
​plt.pie(x,labels=labels)
#[Text(1.09783,0.0690696,'娱乐'),
#  Text(1.05632,0.30689,'育儿'),
#  Text(0.753002,0.801865,'饮食'),
#  Text(-1.06544,-0.273559,'房贷'),
#  Text(0.889919,-0.646564,'交通'),
#  Text(1.05632,-0.30689,'其它')])

在这里插入图片描述

1. 百分比显示 percentage

  • autopct:格式化字符串。
  • 我们定义饼的标签,每个标签所占的数量,%.2f%% 显示百分比,保留 2 位小数。
labels = ['娱乐','育儿','饮食','房贷','交通','其它']
​x = [200,500,1200,7000,200,900]
​plt.title("饼图示例-8月份家庭支出")
​plt.pie(x,labels=labels,autopct='%.2f%%')
#[Text(1.09783,0.0690696,'娱乐'),
#  Text(1.05632,0.30689,'育儿'),
#  Text(0.753002,0.801865,'饮食'),
#  Text(-1.06544,-0.273559,'房贷'),
#  Text(0.889919,-0.646564,'交通'),
#  Text(1.05632,-0.30689,'其它')],
# [Text(0.598816,0.0376743,'2.00%'),
#  Text(0.576176,0.167395,'5.00%'),
#  Text(0.410728,0.437381,'12.00%'),
#  Text(-0.58115,-0.149214,'70.00%'),
#  Text(0.48541,-0.352671,'2.00%'),
#  Text(0.576176,-0.167395,'9.00%')])

在这里插入图片描述

2. 饼状图的分离

  • explode:指定饼图某些部分的突出显示。
  • 我们定义饼的标签,每个标签所占的数量,%.2f%% 显示百分比,保留 2 位小数。
labels = ['娱乐','育儿','饮食','房贷','交通','其它']
x = [200,500,1200,7000,200,900]
​explode = (0.03,0.05,0.06,0.04,0.08,0.21)
​plt.pie(x,labels=labels,autopct='%3.2f%%',explode=explode)

在这里插入图片描述

3. 设置饼状图百分比和文本距离中心位置

  • pctdistance:设置百分比标签与圆心的距离。
  • labeldistance:设置各扇形标签(图例)与圆心的距离。
labels = ['娱乐','育儿','饮食','房贷','交通','其它']
​x = [200,500,1200,7000,200,900]
​explode = (0.03,0.05,0.06,0.04,0.08,0.1)
​plt.pie(x,labels=labels,autopct='%3.2f%%',explode=explode, labeldistance=1.35, pctdistance=1.2)

在这里插入图片描述

4. 图例

labels = ['娱乐','育儿','饮食','房贷','交通','其它']
​x = [200,500,1200,7000,200,900]
​explode = (0.03,0.05,0.06,0.04,0.08,0.1)
​plt.pie(x,labels=labels,autopct='%3.2f%%',explode=explode, labeldistance=1.35, pctdistance=1.2)
plt.legend()

在这里插入图片描述

  • 可以通过设置 x,y 的刻度一样,使其饼图为正圆 plt.axis(‘equal’)。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/354071.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

初步使用MSYS2

在此镜像站点下载, https://mirror.tuna.tsinghua.edu.cn/help/msys2/ 根据资料, MSYS2 (Minimal SYStem 2) 是一个MSYS的独立改写版本,主要用于 shell 命令行开发环境。同时它也是一个在Cygwin (POSIX …

FPGA 10M50DCF672C7G/10M50DCF672C8G/10M50DCF672I7G工业、汽车和消费应用

FPGA现场可编程门阵列 10M50DCF672C7G/10M50DCF672C8G/10M50DCF672I7G 封装FBGA672FBGA672封装图(明佳达电子)描述MAX 10器件是单芯片、非易失性低成本可编程逻辑器件(pld),用于集成最优的系统组件集。MAX 10设备的亮点包括:内部存储双配置闪…

Spring Data JPA 中 CrudRepository 和 JpaRepository 的区别

1 问题描述Spring Data JPA 中,CrudRepository 和 JpaRepository 有何区别?当我在网上找例子的时候,发现它们可以互相替换使用。它们有什么不同呢?为什么你习惯用其中的一个而不是另一个呢?2 CrudRepository 和 JpaRep…

ArcGIS网络分析之发布网络分析服务(二)

在上一篇中讲述了如何构建网络分析数据集,本篇将讲解如何发布网络分析服务。本文将使用上一篇中建立的网络数据集,下载地址在上一篇博文的最后已给出。 之前我们已经实现了基于ArcMap中的网络分析,但是仅仅支持本地是万万不够的,这里我们的目的就是将我们建好的网络分析图…

【OJ】两个圆

📚Description: 直角坐标系内现有两个半径相等的圆,问两圆的位置关系。 位置关系有:重合,相切,相离,相交; 若两圆相交,需要求出两圆的重叠面积。 ⏳Input: 输入包含多组数据&a…

【项目精选】户籍管理系统(视频+论文+源码)

点击下载源码 当今社会人们生活质量越来越高,人们对生活品质的追求不断提升,对于孩子求学,变更住所等情况时有发生,因此对于户籍变动管理就显得十分重要,管理用户的户籍信息可以有效防止信息错乱,信息管理过…

百度沈抖:文心一言将通过百度智能云对外提供服务

2月17日,在2023 AI工业互联网高峰论坛上,百度智能云宣布“文心一言”将通过百度智能云对外提供服务,为产业带来AI普惠。 百度集团执行副总裁、百度智能云事业群总裁沈抖表示,“文心一言”是基于百度智能云技术打造出来的大模型&a…

A Time Series is Worth 64 Words(PatchTST模型)论文解读

摘要 我们提出了一种高效的基于Transformer设计的模型,用于多变量时间序列预测和自我监督表征学习(self-supervised learning)。它基于两个关键部分:1、将时间序列分隔成子序列级别的patches,作为Transformer的输入&a…

Allegro负片层不显示反盘的原因和解决办法

Allegro负片层不显示反盘的原因和解决办法 在用Allegro做PCB设计的时候,负片设计是较为常用的一种方式,有时会出现打开负片层却看不到反盘的情况,如下图 L2层是负片层 L2层仍然只能看到盘 如何才能看到反盘显示的效果,具体操作如下 首先确定L2层层叠里面设置的是负片

java ssm爱宠宠物医院挂号预约系统管理系统设计与实现

本课题所实现的宠物医院网站是基于网页,它可以实现网上预约挂号,评价等基本功能。用户只要手边有一部手机或者一台电脑,可以上网浏览网页,便可以使用本系统,没有时间和地点的限制,使得就医预约,…

枚举类(enum)

定义:在某些情况下,一个类的实例对象是有限且固定的,可将该类称为“枚举类”。枚举类是JDK 1.5 之后提出来的。例如:四季只有春夏秋冬4个季节,性别只有男女2个,故四季类和性别类均可称为“枚举类”。 在自…

python(8.5)--列表习题

目录 一、求输出结果题 二、计算列表元素个数 三、查找是否存在某元素 四、删除某元素 五、如何在列表中插入元素 六、如何从列表中删除重复的元素 七、 如何将列表中的元素按照从小到大的顺序排序 八、从列表中删除重复的元素 九、大到小的顺序排序 一、求输出结…

【源码解析】Ribbon和Feign实现不同服务不同的配置

Ribbon服务实现不同服务,不同配置是通过RibbonClient和RibbonClients两个注解来实现的。RibbonClient注册的某个Client配置类。RibbonClients注册的全局默认配置类。 Feign实现不同服务,不同配置,是根据FeignClient来获取自定义的配置。 示…

【大数据】Apache Spark 3.3.0 正式发布,新特性详解

简介 Apache Spark 3.3.0 从2021年07月03日正式开发,历时近一年,终于在2022年06月16日正式发布,在 Databricks Runtime 11.0 也同步发布。这个版本一共解决了 1600 个 ISSUE,感谢 Apache Spark 社区为 Spark 3.3 版本做出的宝贵贡…

Redis学习【8】之Redis RDB持久化

文章目录Redis 持久化1 持久化基本原理2 RDB(Redis DataBase) 持久化2.1 持久化的执行2.2 手动 save 命令2.3 手动 bgsave 命令2.4 自动条件触发2.5 查看持久化时间3 RDB 优化配置3.1 save3.2 stop-write-on-bgsave-error3.3 rdbcompression3.4 rdbchecksum3.5 sanitize-dump-p…

代码随想录算法训练营第六十三天| 503.下一个更大元素II、42. 接雨水

Leetcode - 503这题其实和下一个更大元素那题一样,只是说可以找自己前面的元素,那我索性就把遍历范围从本序列延长到两个相同序列。这样某个元素寻找下一个更大元素到本序列末尾后还可以继续往下,也就是从序列头开始找。这里依旧是可以用单调…

初识CSS,美化HTML

CSS称为&#xff1a;层叠样式表&#xff08;Cascading style sheets&#xff09;美化HTML即给页面种的HTML标签设置样式CSS语法规则css要写在head标签的里边&#xff0c;title标签的下面&#xff0c;用style标签框住<head> <title>...</title> <style>…

Delphi 中自定义鼠标指针图像

Dephi中的鼠标指针是可以自由定义的&#xff0c;如果是使用系统提供的图标&#xff0c;那么直接通过可视控件的Cursor属性赋值就可以。例如设置Form的鼠标为 crHourGlass 沙漏&#xff1a;Form1.Cursor : crHourGlass;也可以在设计期&#xff08;IDE环境中&#xff09;直接更改…

几行代码,就写完懒加载啦?

Ⅰ、前言 「懒加载」是网页中非常 常见的&#xff1b;为了减少系统的压力&#xff0c;对于一些电商系统出场频率非常高&#xff1b;那么大家一般用什么方式去实现 「懒加载」 呢 &#xff1f; ① 通过 scroll 的形式&#xff1a; 通过 滚动「scroll」事件&#xff0c;然后去判…

关系抽取概述

关系抽取介绍 关系抽取概念字1988年在MUL大会上提出&#xff0c;是信息抽取的基本任务之一&#xff0c;目的是为了识别出文本实体中的目标关系。 知识图是语义关联的实体&#xff0c;它将人们对物理世界的认知转化为计算机能够义结构化方式理解的语义信息。 关系抽取通过识别实…