跑通baseline
- 任务
- 学习内容
- 特征工程
- 模型训练与验证
- bug
- 未纠错的结果
任务
教程部署在百度 AI Studio,可以一键fork运行代码,选择*v100 32g1*的配置,baseline运行大约20分钟,再加上进阶部分大约40分钟
学习内容
特征工程
构建基本的时间特征,提取小时、分钟,刻画不同时间阶段可能存在的差异性信息
模型训练与验证
基线实验是采用CatBoost模型,5折交叉验证的方法训练和测试
CatBoost
模型不需过程调参,可以得到比较稳定的分数
bug
-
kf.split(X)
K折交叉验证是为了得到训练集和验证集的分类索引,这里仅需要对样本进行分类,而不是样本和标签一起 -
模型for循环
交叉验证的结果需要取平均,不应在循环里
未纠错的结果
32g 指显存容量,windows版本可通过cmd+dxdiag查看;ubuntu版本可以通过nvidia-smi命令查看,面板中“Memory-Usage”一项表示显存使用率 ↩︎