请输入正确的账号名!
密码格式有误请验证!
请输入正确的账号名!
请输入正确的账号名!
请输入正确的单位名称!
请输入正确的部门名称!
请输入....!
请输入....!
请输入....!
请输入....!
请输入....!
请填写用户基本资料
请输入正确的账号名!
请输入手机号码!
请输入....!
请输入....!
请输入....!
密码格式有误请验证!
密码格式有误请验证!
请输入....!
基本介绍
工业企业均拥有大量的数据,如何从数据中挖掘知识,并有效服务于自身的业务是各企业非常关注的话题。随着人工智能和数据挖掘技术的发展,市场上已存在有大量开源的和商业的数据建模解决方案,但是对于工业企业,要想建立高质量的模型,并应用于自己的业务场景,仍存在着一定的门槛,数据荒废或投入产出失衡的现象屡见不鲜。在此背景之下,必赢优惠y272net(中国)盐城有限公司通过对工业企业数据建模需求的深度挖掘,研发了一套针对工业用户的数据建模软件DTEmpower。
数据建模软件DTEmpower围绕数据清理、特征生成、敏感性分析和模型训练等数据建模的各个环节,提供有大量算法。通过针对特定场景下算法的深度研发,利用智能调度引擎和超参优化等技术,提高模型质量的同时,降低了对用户数据建模经验的需求。同时DTEmpower提供一套图形化的建模开发环境,所有算法均可通过拖拽的方式进行调用,通过连线的方式进行数据的传递,大幅降低了用户的使用门槛。依托强大的算法和简便的操作,零基础用户也可以利用DTEmpower快速挖掘到优秀的模型。
模型是可复用的知识,DTEmpower秉承这一理念,定义了一套模型交换格式(简称DT模型),挖掘得到的模型可以直接存储为单个模型文件,DT模型可以在DTEmpower的模型运行模块DTEmpower Run(简称DTRun)、必赢优惠y272net(中国)盐城有限公司智能优化设计平台AIPOD等软件中直接调用,服务于实时预警和优化设计等各种应用。
“降低数据建模的门槛、强化模型的知识属性”,DTEmpower针对典型的工业应用场景,提供了从建模到模型管理应用的一站式解决方案,让工业用户可以聚焦于业务而不是疲于数据分析,充分发挥数据的价值。
主要功能及优势
1)丰富而先进的算法工具箱
DTEmpower的核心功能建立于丰富、先进的算法工具箱基础之上。围绕数据清理、特征生成、敏感性分析、回归模型训练、时间序列模型预测等数据建模的各个环节,DTEmpower均提供有丰富的算法控件。在此基础上,“算法有自研,超参有优化,组合有调度,场景有聚焦”,相比于市面上的其他同类算法,DTEmpower的模型训练效果精度更高、稳定性更好。
图 1 DTEmpower内置丰富而先进的算法工具箱
2)零编码建模
DTEmpower提供了图形化的数据建模流程搭建功能。所有的数据及模型操作,均以工具箱中模块的形式提供。用户无需具备编码能力或深入了解算法细节,通过简单的节点拖拽与节点连接即可完成复杂的数据建模流程的构建。
图 2 DTEmpower采用零编码的数据建模流程搭建模式
3)向导式建模
除了图形化建模,DTEmpower还提供了向导式建模,专门为无任何建模基础的工程人员提供的一键式数据建模功能,用户也无需拖拽任何节点就能搭建完整的建模流程。
图3 DTEmpower支持一键式的向导式建模
4)丰富的数据可视化与图表交互
DTEmpower支持对表格数据执行灵活的交互,其中既包括电子表格常见的筛选、排序、统计等,也支持对表格数据做类型丰富且美观的数据可视化图表,方便用户快速掌握数据中存在的规律。
图 4 DTEmpower支持丰富的数据可视化与图表交互
5)智能数据清理算法
数据中的异常点很大程度的影响着模型的质量,因此数据清理至关重要。考虑到工业设计数据集的特性,必赢优惠y272net(中国)盐城有限公司研发了智能数据清理算法AIOD。通过自研的智能调度引擎,管控数十种数据清理算法,一键式精准挖掘出数据集中的“潜在异常点”。
图 5 基于自研算法AIOD完成异常点智能识别
6)针对小规模数据集的AIAgent训练
针对工业设计数据的“小数据集”“数据分布不均”等特点,必赢优惠y272net(中国)盐城有限公司研发了一套智能训练算法AIAgent,通过使用集成算法、智能分层分类以及超参优化等技术,用户无需介入训练过程,一键得到“最优”模型。
图6 船舶兴波阻力数据集AIAgent训练同其他算法训练的效果对比
7)机理模型融合
DTEmpower支持用户在训练流程中嵌入机理模型,以改善模型的精度和提高模型的可解释性。同时还提供模型聚合功能,可以将用户提供的公式模型和数据训练的模型组合,作为单个DT模型导出,从而实现数据挖掘与机理模型的融合。
图 7 DTEmpower支持数据挖掘与机理模型的融合
8)工业设计场景聚焦——智能优化
DT模型的一类典型应用场景是用于产品设计优化、设备运行优化等各类优化问题中。必赢优惠y272net(中国)盐城有限公司智能优化设计平台AIPOD支持在计算流程中一键导入DT模型,借助于SilverBullet算法,进行优化问题求解。
图 8 在AIPOD中一键导入DT模型并进行优化
9)工业运维场景聚焦——智能监盘
智能监盘扩展工具箱在DTEmpower强大的数据建模能力的基础之上,提供了一套针对时间序列的智能预警算法,可以轻松固化专家的判断逻辑,从参数的波动、变化趋势,以及参数和预示模型预测值的相对偏差等多方面对参数进行健康度评估,实现异常早期预警。
图 9 识别时间序列中的异常现象,并给出异常原因,辅助用户快速处置
DTEmpower的案例展示
1)智能数据挖掘
本案例采用一个基于Styblinski-Tang函数的仿真数据集,来展示在DTEmpower中智能模型训练算法AIAgent的效果。Styblinski-Tang函数如下所示,数据建模的目标是获取从x(x1至x5)到y的预测模型。
为了验证AIAgent的优越性,本案例同时新建了对比工程,利用集成学习算法Adaboost节点代替AIAgent节点,在其它配置均相同的情况下,两者响应面对比如图10所示。采用AIAgent算法训练得到的模型的响应面基本完全贴合理论值,精度远高于AdaBoost算法。
(a)AIAgent的响应面,测试精度99.99% | (b)Adaboost的响应面,测试精度79.9% |
图 10 采用AIAgent算法训练得到的模型的响应面基本完全贴合理论值
2)数据前处理与可视化
对数据本身有足够的分析和认知是开展建模前的必要准备工作,因此一个高效、易用的数据前处理与可视化工具可以帮助数据分析与数据建模工作事半功倍。
在本案例中,绘制了2列变量之间的散点图,并在此基础上依次选择线性函数、二次多项式、三次多项式函数、指数函数等多种拟合函数,探索2列变量之间的对应关系,并输出相应的函数表达式、拟合精度等,还支持用户基于拟合公式快速预测新的目标值。
图 11 数据可视化
3)参数时序预测
时序预测问题是一种根据历史的数据,对未来的变化进行预测的问题。在本案例中,以污水处理系统的参数预测为例,演示DTEmpower在面对外界干扰强烈、时变性强、耦合性强、非线性的复杂动态生物化学过程中,基于大量的测量数据构建数据驱动的模型。
通过合理地选择外部特征并引入MDI/PCA等特征工程技术,既可以提升输入信息富集度从而有助于提升模型预测精度,又可以缓解因输入特征过多导致的维度爆炸、模型难以训练的问题,最终实现预测模型的R2指标从0.68提高到0.94。
图12 基于DTEmpower实现“层层递进式”的数据建模水平提升