求真百科歡迎當事人提供第一手真實資料,洗刷冤屈,終結網路霸凌。

變更

前往: 導覽搜尋

冷轧数据清洗与特征选择

增加 209 位元組, 1 年前
無編輯摘要
===技术背景和意义===
冷轧是钢铁冶金工业的最终生产环节,是实现最终钢铁产品高效率、高[[质量]]生产的一个关键环节。随着我国经济发展方式的转变和产业结构的调整,市场对附加值更高的冷轧带钢的需求量越来越大,对钢铁产业尤其是冷轧带钢 <ref>[https://www.sohu.com/a/131733047_649931 【技术】冷轧带钢基础知识],搜狐,2017-04-02</ref> 生产质量提出了更高的要求。目前,一些钢铁制造企业冷轧生产过程中会积累很多过程参数和[[历史]]质量数据,这些数据中存在着大量的噪声数据,而通过数据清洗和特征选择技术可以将冷轧带钢数据整理为规范化的表格数据为后续通过数据挖掘技术来发现数据中的规律并进行冷轧生产质量预测等奠定基础。
===技术要点和优势===
(2)数据对齐:其次通过各工序勾连与长度匹配、头尾一致性进行数据对齐,最终实现数据组织的结构化。数据对齐具体包括显示格式一致性检验、数据去重、按照[[工艺]]流程数据对齐、根据冷轧领域知识修正矛盾内容等。
(3)数据库构建对于经过数据清洗与数据对齐处理后的数据,还需要对其进行数据组织的结构化,形成固定的字段、固定的格式、固定的字段属性、便于二维表储存与管理的结构化数据。根据此结构化数据的字段和数据类型构建[[数据库]] <ref>[https://www.sohu.com/a/326223102_120220592 数据库发展史] ,搜狐,2019-07-12 </ref> 保存冷轧清洗数据。
(4)特征选择:冷轧生产过程中包含很多[[工艺]]参数,所以冷轧带钢数据是典型的高维数据,为了避免高维数据稀疏性导致模型过拟合,必须对数据进行降维操作,而特征选择可以实现此目的。通过机器学习算法并结合专家知识可以提取数据中少量且具有较好表达能力的特征,为后续的冷轧生产质量预测等工作提供数据支持。
768,401
次編輯