（助力国赛）美赛O奖数学建模可视化！！！含代码2（箱型图、旭日图、直方图、三元图、平行坐标图、密度图、局部放大图）

众所周知，数学建模的过程中，将复杂的数据和模型结果通过可视化图形呈现出来，不仅能够帮助我们更深入地理解问题，还能够有效地向评委展示我们的研究成果。
今天，承接《可视化代码1》，作者将与大家分享《可视化代码2》，内含9种强大的数学建模可视化图形及其在实际问题中的应用，包含如下图形：“箱型图”、“旭日图”、“直方图”、“三元图”、“平行坐标图”、“密度图”、“局部放大图”。

如果阅者喜欢此篇分享，认为内容精要、有用、好懂的话，请点赞收藏再走！！！（此为第二部分更新，~~~后续发布第三部分更新）

1. 箱型图：揭示数据分散情况，一目了然的异常检测值检测！

箱型图用于显示一组数据分布情况的标准化方式。它可以展示数据的最小值、第一四分位数（Q1）、中位数、第三四分位数（Q3）以及最大值。箱型图特别适合于比较不同变量的中心位置和分散程度，并且可以用于识别数据中的离群点。

1.1不带有数据点的箱型图

#绘制不带有数据点的箱型图代码如下：
import plotly.io as pio
import plotly.graph_objs as go
import plotly.express as px
from plotly.subplots import make_subplots
import pandas as pd

# can be `plotly`, `plotly_white`, `plotly_dark`, `ggplot2`, `seaborn`, `simple_white`, `none`
pio.templates.default = 'plotly_white'

x = ['day 1', 'day 1', 'day 1', 'day 1', 'day 1', 'day 1',
     'day 2', 'day 2', 'day 2', 'day 2', 'day 2', 'day 2']

fig = go.Figure()

fig.add_trace(go.Box(
    y=[0.2, 0.2, 0.6, 1.0, 0.5, 0.4, 0.2, 0.7, 0.9, 0.1, 0.5, 0.3],
    x=x,
    name='kale',
    marker_color='#3D9970'
))
fig.add_trace(go.Box(
    y=[0.6, 0.7, 0.3, 0.6, 0.0, 0.5, 0.7, 0.9, 0.5, 0.8, 0.7, 0.2],
    x=x,
    name='radishes',
    marker_color='#FF4136'
))
fig.add_trace(go.Box(
    y=[0.1, 0.3, 0.1, 0.9, 0.6, 0.6, 0.9, 1.0, 0.3, 0.6, 0.8, 0.5],
    x=x,
    name='carrots',
    marker_color='#FF851B'
))

fig.update_layout(
    yaxis_title='normalized moisture',
    boxmode='group'  # group together boxes of the different traces for each value of x
)

fig.write_html('test.html')

绘制不带有数据点的箱型图如下图1所示：

在这里插入图片描述

图1 不带数据点的箱型图

1.2带有数据点的箱型图

#绘制带有数据点的箱型图的代码如下：
import plotly.io as pio
import plotly.graph_objs as go
import plotly.express as px
from plotly.subplots import make_subplots
import pandas as pd
import numpy as np

# can be `plotly`, `plotly_white`, `plotly_dark`, `ggplot2`, `seaborn`, `simple_white`, `none`
pio.templates.default = 'plotly_white'

fig = go.Figure()
fig.add_trace(go.Box(y=np.random.rand(100), name='trace1'))
fig.add_trace(go.Box(y=np.random.rand(100), name='trace2'))
fig.add_trace(go.Box(y=np.random.rand(100), name='trace3'))

# boxpoints 可以为 `all`, `outliers`, `suspectedoutliers`, False
# 使用jitter参数随机对点进行抖动，防止重叠
fig.update_traces(boxpoints='all', jitter=0.2)

fig.write_html('test.html')

绘制带有数据点的箱型图如下图2所示：

在这里插入图片描述

图2 带有数据点的箱型图

2 旭日图：层层深入，洞察数据的层级结构与比例关系！

旭日图是多层次的饼状图，用于显示层级结构中每个级别的大小。从中心向外，每一层代表数据结构的一级。旭日图适用于表现比例关系以及如何将整体分解为不同的部分。

#旭日图的代码
import plotly.io as pio
import plotly.graph_objs as go
import plotly.express as px
from plotly.subplots import make_subplots
import pandas as pd
import numpy as np

# can be `plotly`, `plotly_white`, `plotly_dark`, `ggplot2`, `seaborn`, `simple_white`, `none`
pio.templates.default = 'plotly_white'

# 加载数据
df = px.data.gapminder().query("year == 2007")
print(df)

fig = px.sunburst(df, path=['continent', 'country'], values='pop',
                  color='lifeExp', hover_data=['iso_alpha'],
                  color_continuous_scale=px.colors.diverging.Tealrose,
                  color_continuous_midpoint=np.average(df['lifeExp'], weights=df['pop']))

fig.write_html('test.html')

绘制地图（点）如下图3所示：

在这里插入图片描述

图3 旭日图

3.直方图: 分布一览无余，直观展示数据的频率分布！

直方图是显示数据频率分布的图表。通过将数据分组到连续的、通常是等宽的区间，然后计算每个区间中数据点的数量或比例，以柱状图的形式展示。直方图能够展现数据集中的模式，例如正态分布、偏态分布或者双峰分布等。

#直方图的代码
import plotly.io as pio
import plotly.graph_objs as go
import plotly.express as px
from plotly.subplots import make_subplots
import pandas as pd

pio.templates.default = 'ggplot2'

# 加载数据
df = px.data.tips()
print(df)

fig = px.histogram(df, x="total_bill", color="sex",
                   marginal="rug",  # can be `box`, `violin`
                   hover_data=df.columns)

fig.write_html('test.html')

绘制地图（线）如下图3所示：

图4 直方图

4. 三元图：三组分的平衡艺术，探索组成成分的相对比例！

三元图是一种三变量图形，常用于展示三个组成部分的比例，它们的总和恒等于一个定值，通常为100%。三元图通常用于地质学和化学，以显示不同成分的相对比例。

#绘制三元图的代码
import plotly.io as pio
import plotly.graph_objs as go
import plotly.express as px
from plotly.subplots import make_subplots
import pandas as pd
import numpy as np

# pandas打印时显示所有列
pd.set_option('display.max_columns', None)

# can be `plotly`, `plotly_white`, `plotly_dark`, `ggplot2`, `seaborn`, `simple_white`, `none`
pio.templates.default = 'plotly_white'

# 加载数据
df = px.data.election()
print(df.head())

fig = px.scatter_ternary(df, a="Joly", b="Coderre", c="Bergeron", hover_name="district",
                         color="winner", size="total", size_max=15,
                         color_discrete_map={"Joly": "blue", "Bergeron": "green", "Coderre": "red"})

fig.write_html('test.html')

绘制三元图如下图5所示：
请添加图片描述

图5 三元图

5.平行坐标图: 多维度数据的交错舞蹈，寻找变量间的关联！

平行坐标图用于可视化高维数据的图形。它将每个数据点在每个变量上的值用折线连接起来。所有的变量都被放在平行的直线上，这些直线之间的距离是均等的。这种图可以帮助识别变量之间的相似性和差异性。

5.1 特征全为连续型变量

# 特征为连续型变量的平行坐标图的代码
import plotly.express as px
import pandas as pd

# 加载鸢尾花数据集
df = px.data.iris()
print(df.head())

# 参数见文档：https://plotly.com/python-api-reference/generated/plotly.express.parallel_coordinates
fig = px.parallel_coordinates(
    df,
    # dimensions=['sepal_width', 'sepal_length', 'species_id'],
    color='species_id',
    labels={"species_id": "Species", "sepal_width": "Sepal Width", "sepal_length": "Sepal Length",
            "petal_width": "Petal Width", "petal_length": "Petal Length"},
    color_continuous_scale=px.colors.diverging.Tealrose,
    color_continuous_midpoint=2
)

# 隐藏色柱，色柱对于分类型数据无用处
fig.update_layout(coloraxis_showscale=False)

fig.write_html('test.html')

绘制连续型变量的平行坐标图如图6所示：
请添加图片描述

图6 连续型变量的平行坐标图

5.2 特征为离散型变量

# 特征为离散型变量的平行坐标图的代码
import plotly.express as px
import pandas as pd

df = px.data.tips()
print(df)

fig = px.parallel_categories(
    df,
    color="size",
    color_continuous_scale=px.colors.diverging.Tealrose,
    color_continuous_midpoint=4
)

fig.update_layout(coloraxis_showscale=False)

fig.write_html('test.html')

绘制特征为离散型变量的平行坐标图，如图7所示：
在这里插入图片描述

图7 连续型变量的平行坐标图

6. 密度图: 从数据的密集云雾中，勾勒出概率的轮廓！

密度图也称为核密度估计图，它是直方图的连绑版本，用于显示连续变量的概率密度函数的估计。这种图形可以帮助我们理解数据的分布，特别是当需要比较两个或更多分布时。

#绘制密度图的代码
import plotly.io as pio
import plotly.graph_objs as go
import plotly.express as px
from plotly.subplots import make_subplots
import pandas as pd
import numpy as np

# can be `plotly`, `plotly_white`, `plotly_dark`, `ggplot2`, `seaborn`, `simple_white`, `none`
pio.templates.default = 'plotly_white'

x = np.random.uniform(-1, 1, size=500)
y = np.random.uniform(-1, 1, size=500)

fig = go.Figure(go.Histogram2dContour(
    x=x,
    y=y,
    colorscale='Jet',
    contours=dict(  # 轮廓
        showlabels=True,
        labelfont=dict(
            family='Raleway',
            color='white'
        )
    )
))

fig.write_html('test.html')

绘制密度图如下图8所示：
在这里插入图片描述

图8 密度图

7. 局部放大图: 细节观察

局部放大图可以帮助我们放大观察图表中的特定区域，以便更清晰地查看细节。在这里作者分享两种局部放大图。

#第二种局部放大图的代码
import matplotlib.pyplot as plt
from matplotlib.patches import  ConnectionPatch
import numpy as np

def zone_and_linked(ax,axins,zone_left,zone_right,x,y,linked='bottom',
                    x_ratio=0.05,y_ratio=0.05):
    """缩放内嵌图形，并且进行连线
    ax:         调用plt.subplots返回的画布。例如： fig,ax = plt.subplots(1,1)
    axins:      内嵌图的画布。 例如 axins = ax.inset_axes((0.4,0.1,0.4,0.3))
    zone_left:  要放大区域的横坐标左端点
    zone_right: 要放大区域的横坐标右端点
    x:          X轴标签
    y:          列表，所有y值
    linked:     进行连线的位置，{'bottom','top','left','right'}
    x_ratio:    X轴缩放比例
    y_ratio:    Y轴缩放比例
    """
    xlim_left = x[zone_left]-(x[zone_right]-x[zone_left])*x_ratio
    xlim_right = x[zone_right]+(x[zone_right]-x[zone_left])*x_ratio

    y_data = np.hstack([yi[zone_left:zone_right] for yi in y])
    ylim_bottom = np.min(y_data)-(np.max(y_data)-np.min(y_data))*y_ratio
    ylim_top = np.max(y_data)+(np.max(y_data)-np.min(y_data))*y_ratio

    axins.set_xlim(xlim_left, xlim_right)
    axins.set_ylim(ylim_bottom, ylim_top)

    ax.plot([xlim_left,xlim_right,xlim_right,xlim_left,xlim_left],
            [ylim_bottom,ylim_bottom,ylim_top,ylim_top,ylim_bottom],"black")

    if linked == 'bottom':
        xyA_1, xyB_1 = (xlim_left,ylim_top), (xlim_left,ylim_bottom)
        xyA_2, xyB_2 = (xlim_right,ylim_top), (xlim_right,ylim_bottom)
    elif  linked == 'top':
        xyA_1, xyB_1 = (xlim_left,ylim_bottom), (xlim_left,ylim_top)
        xyA_2, xyB_2 = (xlim_right,ylim_bottom), (xlim_right,ylim_top)
    elif  linked == 'left':
        xyA_1, xyB_1 = (xlim_right,ylim_top), (xlim_left,ylim_top)
        xyA_2, xyB_2 = (xlim_right,ylim_bottom), (xlim_left,ylim_bottom)
    elif  linked == 'right':
        xyA_1, xyB_1 = (xlim_left,ylim_top), (xlim_right,ylim_top)
        xyA_2, xyB_2 = (xlim_left,ylim_bottom), (xlim_right,ylim_bottom)
        
    con = ConnectionPatch(xyA=xyA_1,xyB=xyB_1,coordsA="data",
                          coordsB="data",axesA=axins,axesB=ax)
    axins.add_artist(con)
    con = ConnectionPatch(xyA=xyA_2,xyB=xyB_2,coordsA="data",
                          coordsB="data",axesA=axins,axesB=ax)
    axins.add_artist(con)


# 示例：
if __name__ == '__main__':
    # x坐标
    x = np.arange(1, 1001)

    # 生成y轴数据，并添加随机波动
    y1 = np.log(x)
    indexs = np.random.randint(0, 1000, 800)
    for index in indexs:
        y1[index] += np.random.rand() - 0.5

    y2 = np.log(x)
    indexs = np.random.randint(0, 1000, 800)
    for index in indexs:
        y2[index] += np.random.rand() - 0.5

    y3 = np.log(x)
    indexs = np.random.randint(0, 1000, 800)
    for index in indexs:
        y3[index] += np.random.rand() - 0.5

    # 绘制主图
    fig, ax = plt.subplots(1, 1, figsize=(12, 7))
    ax.plot(x, y1, color='#f0bc94', label='trick-1', alpha=0.7)
    ax.plot(x, y2, color='#7fe2b3', label='trick-2', alpha=0.7)
    ax.plot(x, y3, color='#cba0e6', label='trick-3', alpha=0.7)
    ax.legend(loc='right')

    # plt.show()

    # 绘制缩放图
    axins = ax.inset_axes((0.4, 0.1, 0.4, 0.3))

    # 在缩放图中也绘制主图所有内容，然后根据限制横纵坐标来达成局部显示的目的
    axins.plot(x, y1, color='#f0bc94', label='trick-1', alpha=0.7)
    axins.plot(x, y2, color='#7fe2b3', label='trick-2', alpha=0.7)
    axins.plot(x, y3, color='#cba0e6', label='trick-3', alpha=0.7)

    # 局部显示并且进行连线
    zone_and_linked(ax, axins, 100, 150, x, [y1, y2, y3], 'right')

    plt.show()