Loading
0

使用Cloudera机器学习为喷气发动机建立预测性维护模型

介绍

经营一家大型商业航空公司需要对关键部分进行复杂的管理,包括燃料期货合同、飞机维护和客户期望。仅美国的航空公司平均每天就有约45000个航班,每年运送超过1000万名乘客(资料来源:FAA)。航空公司通常是在利润非常微薄的情况下运营,任何航班延误都会立即激怒或挫伤客户。飞行本身并不危险,但失败的后果却是灾难性的。航空公司拥有如此复杂的商业模式,包含了精简供应链、预测性维护和坚定不移的客户满意度的文化。

为了最大限度地保障所有乘客和机组人员的安全,同时也为他们带来利润,航空公司在预测分析方面进行了大量投资,以深入了解维持发动机实时性能的最具成本效益的方式。此外,航空公司还通过利用汉莎技术公司等维护、大修和维修(MRO)机构,确保其机队的可用性和可靠性。

汉莎技术公司是一家MRO公司,它与Cloudera合作建立了一个预测性维护平台,为其全球800个MRO设施网络中的5000架飞机提供服务。Lufthansa Technik扩展了在飞机发动机上放置传感器的标准做法,并使预测性维护能够自动执行解决方案。通过将深厚的航空公司运营专业知识、数据科学和发动机分析结合到预测性维护计划中,汉莎技术公司现在可以确保关键部件在需要的时候在地面上(OTG),而不是整架飞机都在OTG,不能产生收益。

本文的目的是展示如何使用Cloudera机器学习(CML),运行Cloudera数据平台(CDP),建立一个基于高级机器学习概念的预测性维护模型。

流程

许多公司利用库建立机器学习模型,无论是为自主车辆建立感知层,让车辆自主运行,还是为复杂的喷气发动机建模。Kaggle是一个为构建机器学习模型提供测试训练数据集的网站,它提供了来自NASA的模拟数据集,用于测量涡轮风扇喷气发动机的发动机部件退化。本博客中的模型是基于CML建立的,是基于输入各种发动机参数,显示发动机温度、油耗、振动或燃料与氧气混合的典型传感器值(见下图)。需要注意的一点是,"故障 "一词并不意味着灾难性的故障,而是指其某一部件(泵、值等)没有按照规范运行。航空公司在设计飞机时,都是以99.999%的可靠性运行的。

涡扇喷气发动机

第一步:使用训练数据创建模型/分类器

首先,组织了4组不同条件和故障模式的测试和训练数据,为CML做准备(见下图中的方框1)。

每一组训练数据都显示了每次飞行的发动机参数,同时每台发动机都要 "飞行",直到发动机部件发出故障信号。这是在海平面和所有飞行条件下完成的。这些数据将用于训练模型,以预测给定的发动机在故障前有多少次飞行。

对于每个训练集,都有一个相应的测试数据集,它提供了100台处于不同寿命阶段的喷气发动机的数据,并提供了实际值,用于测试预测模型的准确性。

显示如何使用CML建立ML训练模型的图表

第二步:对模型进行迭代,验证并提高有效性

CML被用来创建一个模型,利用所提供的测试和训练数据集来估计给定发动机的剩余使用寿命(RUL)。一个星期的阈值--将部件放置在地面上的时间允许--计划用于在潜在的发动机部件故障之前向航空公司发出警报的场景。假设每天有四个航班,这意味着航空公司希望有把握地知道一个发动机是否会在40个航班内发生故障。对每台发动机进行了模型测试,并将结果分为40次飞行内潜在故障的真假(见下表)。

表中数据是根据一周40次飞行的数据得出的

第三步:对结果应用附加成本值

在没有预防性维护的情况下,发动机寿命耗尽或发生故障会影响安全,更换一台发动机的费用要多出数百万美元。如果在发动机寿命耗尽之前对其进行保养或大修,大修费用会大大降低。然而,如果发动机过早地进行大修,则有可能还能利用发动机的寿命。本模型中对上述每种大修结果的估计成本见下图(见下图)。

成本效益混乱矩阵

结论

使用Cloudera机器学习(CML)来分析Kaggle提供的NASA喷气发动机模拟数据,预测性维护模型以非常高的准确性预测了发动机何时可能出现故障或何时需要大修。将成本效益分析与该预测模型与测试数据集相结合,表明在所有应用场景中都能显著节省成本。航空公司在做决策时,总是先考虑安全,再考虑利润。预测性维护是首选,因为它总是最安全的选择,而且与被动式(故障后更换发动机)或主动式(更换发动机前更换部件)相比,它的维护成本大大降低。

Cloudera试用和报价

关于Cloudera

在 Cloudera,我们相信数据可以使今天的不可能,在明天成为可能。我们使人们能够将复杂的数据转换为清晰而可行的洞察力。Cloudera 为任何地方的任何数据从边缘到人工智能提供企业数据云平台服务。在开源社区不懈创新的支持下,Cloudera推动了全球最大型企业的数字化转型历程。

慧都大数据专业团队为企业提供Cloudera大数据平台搭建,免费业务咨询,定制开发等完整服务,快速、轻松、低成本将任何Hadoop集群从试用阶段转移到生产阶段。

欢迎拨打慧都热线023-68661681或咨询慧都在线客服,我们有专业的大数据团队,为您提供免费大数据相关业务咨询!