为了更好的阅读体验,建议移步至笔者的博客阅读:解决在 yolov8 训练自己的数据集时,matplotlib 中文乱码问题
在 yolov8 训练自己的数据集时,如果 class 字典使用了中文,则在训练过程中会出现形如下面的警告:
C:\Users\woodwhales\AppData\Roaming\Python\Python311\site-packages\ultralytics\utils\metrics.py:427: UserWarning: Glyph 26222 (\N{CJK UNIFIED IDEOGRAPH-666E}) missing from current font.
fig.savefig(plot_fname, dpi=250)
步骤1:找到 matplotlib 的字体文件目录
执行下述 python 脚本:
import matplotlib
print(matplotlib.matplotlib_fname())
执行上述脚本后,可以看到 matplotlibrc 文件的所在目录:
C:\programs\anaconda3\Lib\site-packages\matplotlib\mpl-data\matplotlibrc
步骤2:将中文字体保存到 matplotlib
在步骤1 的基础上,可以得到 matplotlib 的文件根目录是:C:\programs\anaconda3\Lib\site-packages\matplotlib\mpl-data,那么字体文件目录就在 C:\programs\anaconda3\Lib\site-packages\matplotlib\mpl-data**\fonts\ttf**
在 ttf 文件目录中拷贝中文字体,格式要求为 ttf,笔者使用的是微软雅黑,可以在这里下载:Microsoft YaHei.zip
windows系统中都有微软雅黑,文件目录为:C:\Windows\Fonts,但是其格式为 ttc,可以使用这个网站在线转换为 ttf:https://transfonter.org/ttc-unpack
步骤3:清除 matplotlib 缓存
执行下述 python 脚本:
import shutil
import matplotlib
shutil.rmtree(matplotlib.get_cachedir())
步骤4:检查中文字体是否生效
执行下述 python 脚本:
import matplotlib
print([f for f in matplotlib.font_manager.fontManager.ttflist if 'Microsoft YaHei' in f.name])
可以得到对应字体信息:
[FontEntry(fname='C:\\programs\\anaconda3\\Lib\\site-packages\\matplotlib\\mpl-data\\fonts\\ttf\\Microsoft YaHei.ttf', name='Microsoft YaHei', style='normal', variant='normal', weight=400, stretch='normal', size='scalable'), FontEntry(fname='C:\\Windows\\Fonts\\msyhbd.ttc', name='Microsoft YaHei', style='normal', variant='normal', weight=700, stretch='normal', size='scalable'), FontEntry(fname='C:\\Windows\\Fonts\\msyh.ttc', name='Microsoft YaHei', style='normal', variant='normal', weight=400, stretch='normal', size='scalable'), FontEntry(fname='C:\\Windows\\Fonts\\msyhl.ttc', name='Microsoft YaHei', style='normal', variant='normal', weight=290, stretch='normal', size='scalable')]
步骤5:matplotlib 使用中文字体
在训练集脚本的最开始,增加如下代码:
import matplotlib
matplotlib.rcParams['font.family'] = ['Microsoft YaHei']