本文主要针对机器学习知识薄弱,不太擅长搭建模型同学使用。
本文主要是讲解可以快速轻松实现可视化、数据预处理、批量模型构建。帮助大家轻松做到可视化和建模。特别是机器学习不扎实同学。
数据科学模型开发管道涉及各种组件,包括数据收集、数据处理、探索性数据分析、建模和部署。在训练机器学习或深度学习模型之前,必须清理或处理数据集并使其适合训练。处理缺失记录、删除冗余特征和特征分析等过程是数据处理组件的一部分。
通常,这些过程是重复的,并且涉及大部分模型开发工作时间。各种开源 Auto-ML 库通过几行 Python 代码使整个管道自动化,但它们中的大多数表现得像一个黑盒子,并没有给出它们如何处理数据集的直觉。
文章目录
-
- 模块介绍
- 入门:轻松批量建模
- 入门:批量可视化
- 案例:泰坦尼克号幸存者预测
-
- 读取数据
- 数据预处理
- 探索性数据分析
- 快速批量模型搭建和训练
- 更高级的模型训练
- 限制
- 术语说明