https://github.com/pengzhiliang/Conformer
抽空测试了conformer,训练起来很简单,但是会遇到一个问题:
Loss is nan, stopping training
我用的默认配置,不知道为什么会有这个问题,知道的来探讨下。
1.数据准备
我直接拿了猫狗大战的数据来测试,下面是目录结构
一级目录
二级目录 ,注意二级目录就是按类别放图像就好了
train 和 val是我手动划分的。下面是数据的百度网盘链接
链接:https://pan.baidu.com/s/1JQB96Ddu-PLVvK0YECVx4g
提取码:z23o
--来自百度网盘超级会员V6的分享
2.训练
训练其实很简单,只需要在参数部分改下面两个地方就好了,一个是数据的根目录,一个是存出的路径(新建一个目录),不给路径的话就会只训练,不产生模型。改完以后直接运行,也不用像源码链接一样在命令行输入一大串,当然你如果想的话也行,其实参数都在default里加就行,命令行不方便
3.预测
预测和训练一样,只是改参数,那就别改来改去了,直接复制一份main.py改成inference.py把下面的参数改下。改完就会直接运行测试代码了,结果会给出val的精度
最初的问题如果有人也遇到了,找到解决方法评论说一下吧。