获取工业大数据途径
- Retrospective Study(回溯性研究):完全依赖于现有的历史数据,去数据挖掘、学习和建模;
- Observational Study(观察性研究):在一段时间内观察要研究的工业过程,微调相关的控制参数,看系统反应,捜集相关数据;
- Designed Experiments(设计实验):有目的,有计划的改变所要研究的工业过程或者系统的控制变量,捜集数据,推断各个因素之间的关系,以期全面掌握系统的特性;
预测建模的经典方法
交叉融合:机理及物理模型、结构因果关系、因果图模型、统计模型。
经典数据挖掘、预测建模流程
CRISP-DM(Cross-Industry Standard Process for Data Mining)是欧盟1999年起草的跨行业数据挖局额标准流程。22年工业界和学术界基本都采纳了CPISP-DM,对于数据挖掘流程的创新研究较少。
组织学习和知识创造流程
数据驱动的知识创造过程
提高泛化能力的生产工艺
- 简单原则(奥坎姆剃刀原则)
- 同时训练多个模型和组装模型
- 机理融入到数据建模
- 特征变换与选择
- 数据预处理
- 模型/数据切割
提高自适应能力的工艺流程
模型的维护保养
风机叶片结冰故障预测示例
以上数据通过以下方式剔除:
强规则过滤
天过热,风速过大时不结冰(所以可以剔除)