共计 3657 个字符,预计需要花费 10 分钟才能阅读完成。
MTBF(平均故障间隔时间)是一种用于预测机械设备故障之间时间的计算方法。接下来,我们将讨论MTBF的计算方法、需要注意的陷阱,以及如何提高MTBF。
什么是MTBF?
MTBF(Mean Time Between Failures,平均故障间隔时间)是指在正常工作时间内,设备发生固有故障之间的预测时间。换句话说,MTBF是一个维护指标,单位为小时,表示设备在没有中断的情况下能够运行多长时间。需要注意的是,MTBF仅适用于可修复的设备,并作为计划关键设备修复时不可避免的工具之一。
在计算MTBF之前,你需要理解它如何影响设备的可靠性和可用性。通常情况下,较高的可靠性和较高的可用性是并行的,但这两个术语并不能互换。可靠性是指资产或组件在特定条件下,在预定时间内执行其所需功能的能力。换句话说,它是指设备在没有故障的情况下能够按预期完成任务的可能性。以飞机为例,其使命是安全完成飞行,并将乘客平安送达目的地,而不发生严重故障。
可用性是指在需要使用时,资产或组件能够正常工作并可被访问的时间。换句话说,它是指设备随时能够执行其预定功能的可能性。可用性由系统的可靠性和故障发生后的恢复时间决定。通常,当故障发生时,可靠性和可用性是一起考虑的,因为一旦发生故障,关键变量就是尽快恢复设备的正常运行。
MTBF是衡量系统可靠性的基本指标;MTBF越高,产品的可靠性就越高。这一关系可以通过公式表示:可靠性 = e^-(时间 / MTBF)。
你可能会遇到几种MTBF的变体,它们包括:系统中止的平均时间(MTBSA)、关键故障的平均时间(MTBCF)和非计划停机的平均时间(MTBUR)。这些变体通常用于区分关键故障和非关键故障。
MTBF的计算方法
MTBF的计算方法是将设备的总运行时间(正常运行时间)除以该期间内发生的故障次数。
MTBF= 总运行时间 / 故障次数
具体分解来看,MTBF的计算步骤如下:
- 计算总运行时间:假设你有一个仓库,里面有40个小部件,每个部件经过400小时的测试。所有测试时间总和为16,000小时(40 x 400 = 16,000)。
- 确定故障次数:统计所有测试过程中发生的故障次数。假设在这次测试中,共有20次小部件发生故障。
- 计算MTBF:现在,我们知道测试的总时长为16,000小时,发生了20次故障,因此可以计算MTBF:16,000小时 / 20次故障 = 800小时。
这意味着什么呢?在这个例子中,MTBF并不是说每个小部件应该持续运行800小时,而是指在一组部件中,平均每800小时会发生一次故障。换句话说,MTBF并不是预测单个部件的行为,而是预测一组部件的行为。
需要理解的是,所谓的“时间”并不总是指实际的时钟时间;它也可能是系统实际运行的时间。例如,你可能有一台机器每天运行8小时,它的使用寿命可能是全天24小时运行的同一台机器的三倍。尽管如此,两台机器的MTBF仍然是相同的,因为它们的总运行时间是相等的。
再来看一个MTBF计算的例子。假设你有一台瓶装机,设计为每天运行12小时,这台瓶装机在正常运行10天后发生故障。在这个例子中,MTBF为120小时。
MTBF= (12小时/天 x 10天) / 1次故障 = 120小时
如果故障次数增加且故障发生时间跨度较长,那么计算MTBF就需要更多步骤。例如,假设这台瓶装机每天运行12小时,10天内发生了两次故障。第一次故障发生在运行20小时后,修复时间为2小时;第二次故障发生在运行60小时后,修复时间为3小时。为了计算MTBF,我们需要先计算总的正常运行时间。总的正常运行时间为:20小时(第一次故障前的运行时间) + 18小时(第一次故障修复后的运行时间) + 57小时(第二次故障修复后的运行时间)。
因此,MTBF的计算如下:MTBF = (20小时 + 38小时 + 57小时) / 2次故障 = 57.5小时 / 2次故障 = 57.5小时。
MTBF的误解
关于MTBF(平均故障间隔时间)有一个常见的误解,那就是将其与“设备在发生故障前的工作小时数”或“使用寿命”混为一谈。如果你得到了一个非常高的MTBF值(这并不罕见),你可能会觉得系统不可能在没有故障的情况下运行这么长时间。高MTBF值的原因在于,它们通常是基于设备在“正常”或“有用”使用寿命期间的故障率计算的,假设该设备会以相同的故障率持续下去。因此,MTBF和使用寿命之间不应存在直接的关联。你可以拥有一台MTBF非常高,但预计使用寿命却很低的设备。
Wendy Torell 和 Victor Avelar 在他们的白皮书《平均故障间隔时间:解释标准》中举了一个例子,使用人类作为示例来说明这一点。假设你有500,000名25岁的人组成的样本群体。在一年的时间里,收集这些人群体的故障数据(即死亡人数)。这些人的操作寿命是500,000 x 1年 = 500,000人年。在这一年里,共有625人死亡。因此,故障率为625次故障 / 500,000人年 = 0.125% / 年。那么,MTBF就是1 / 0.00125 = 800年。
这个例子告诉我们,尽管25岁的人群体的MTBF值很高,但他们的预期寿命(即服务寿命)要短得多,而且与MTBF值没有直接关联。
像机器一样,人类的故障率也不是恒定的。随着年龄增长,更多的故障会发生(我们的身体会磨损)。因此,唯一能够使MTBF与使用寿命相关的方法,是等到所有25岁的人群体到达生命的终点,然后才能计算出他们的平均寿命,这个数字大约是75-80年。
那么,25岁的人群体的MTBF是80年还是800年?Torell 和 Avelar 解释说,这取决于假设。在这种情况下,80年的MTBF更准确地反映了“产品”(人类)的寿命。而当涉及到机械产品时,涉及的变量更多,其中最关键的变量就是时间。
如何提高MTBF
机器故障的影响可能是重大的,通常会导致生产损失,并增加维护时间。找出故障的根本原因是解决问题、减轻故障影响,甚至预防未来故障的最佳方法,同时还能提高MTBF。以下是一些提高MTBF的方法:
- 改进预防性维护流程:一个经过深思熟虑的预防性维护计划能够大大提高MTBF。每当你能够采取主动而非被动的维护措施时,就有机会在故障发生之前进行干预。一个执行不当的预防性维护计划实际上可能会对MTBF产生负面影响。不充分的培训、缺乏或设计不良的手册和检查清单,都可能导致设备快速故障。
- 进行根本原因分析:找出故障发生的根本原因能够帮助你采取措施,避免同样的故障再次发生,或至少减少故障的频率。与预防性维护类似,根本原因分析可以通过提出长期解决方案间接提高MTBF。例如,如果你发现某个部件经常出现故障,你可以考虑用更高质量的部件替换它。
- 建立基于状态的维护:如果你能够建立一个预警系统,提前发现设备问题并采取措施避免故障,那么你可能会提高MTBF并减少停机时间。尽管建立基于状态的维护计划并不总是容易的,但你可以从实施全面生产维护计划(TPM)开始。
MTBF的潜在问题
在使用MTBF进行可靠性分析时,了解潜在的问题非常重要。MTBF的计算结果可能会因“故障”和“运行时间”的定义不同而有所差异,并且还取决于你是计算单个设备的MTBF还是整个过程的MTBF。
- MTBF假设故障率恒定:MTBF计算的一部分是统计故障次数。问题出现在当某些不可控因素导致故障时,例如暴风雨导致停电、洪水引发短路等。这些故障有时被称为“天灾”,而这些因素可能会使“故障”的定义变得模糊不清。故障是否仅指设备故障?故障是否包括任何生产中断,不论原因如何?在计算MTBF时,是否应将所有类型的停机包括在内,从而导致MTBF值较低?还是应该排除某些类型的停机,从而得到更高的MTBF值?确保你清楚在计算MTBF时包括了哪些故障,并了解为什么这些故障被选择纳入。
- 操作时间的定义不同:你何时认为设备处于“运行”状态?鉴于部件或组件在运行过程中会因承受的压力而逐渐退化,压力越大,对部件的使用寿命影响越大。举个例子,如果一辆车停在红绿灯前,它的变速箱和传动系统并没有被使用,发动机的工作压力最小,几乎没有磨损。如果你计算这辆停着的车的MTBF,是不是应该将它在红灯下的停驻时间也算入其中,还是只计算它加速并在高速下运行的时间? 同理,你是否应该将设备的操作时间定义为任何开启的时间,还是只计算设备在正常工作负荷下的时间?如果你选择使用前者计算MTBF,那么你的MTBF值会更高,但这个值并不代表设备在正常工作负荷下持续运行的情况。因此,定义设备的操作时间对于计算MTBF至关重要。
- 选择监测的设备(坏演员):你还需要决定是要测量整个过程的MTBF,还是只测量过程中的单个设备。需要注意的是,整个过程在任何一个关键设备故障时都会受到影响。这些关键设备被称为“坏演员”,应当被标记为影响MTBF的因素。那些选择测量整个过程的人通常会发现,由于“坏演员”的影响,他们无法得到一个较高的MTBF值。因此,建议单独测试每个设备,以避免这一问题。
如果你提前考虑到这些潜在问题,MTBF仍然是评估资产可靠性的一个有用工具。