Философия обслуживания - Википедия - Maintenance philosophy

Философия обслуживания представляет собой сочетание стратегий, которые гарантируют, что элемент работает должным образом при необходимости.^[1]^[2]

Определение

Техническое обслуживание - это форма управление рисками это требуется тогда и только тогда, когда элемент не удовлетворяет минимальному уровню характеристик спецификации, когда требуются элементы или система.

Техническое обслуживание является необязательным и может не требоваться, если частично отказавший элемент все еще удовлетворяет минимальному уровню технических характеристик или если элемент не требуется в течение определенного периода времени.

Техническое обслуживание проходит в четыре этапа.

Обнаружение сбоев
Локализация отказов
Корректирующее действие
Оперативная проверка

Элемент называется деградированный когда есть неисправности, но нормальная работа может продолжаться.

Автоматическое восстановление используется, чтобы избежать необходимости обслуживания.

Автоматическое восстановление после сбоя требуется для систем и ресурсов, к которым невозможно получить доступ во время развертывания, таких как ракеты, ракеты, спутники, подводные аппараты и предметы, которые закопаны или инкапсулированы. Есть несколько подходов.

Индивидуальные элементы, разработанные специально для сверхвысокой надежности
Избыточные элементы с функциями реконфигурации, которые автоматически обходят отказ
Испытания партии для уменьшения производственных дефектов

Избыточные элементы увеличивают частоту отказов и снижают надежность, если восстановление не происходит автоматически.

Обнаружение сбоев

Обнаружение сбоев включает две разные стратегии обслуживания, которые зависят от стоимости жизненного цикла и доступности.

Условный
Периодический

Условный

Условное обслуживание полагается на индикаторы, которые сообщают пользователям о сбое элемента.

Система полностью вышла из строя и не может работать должным образом
Система будет работать, как ожидалось, но ее работа ухудшилась

Для этого требуется автоматическое обнаружение неисправностей и составление отчетов.

Техническое обслуживание по состоянию (CBM) требует четко видимых или звуковых уведомлений, подходящих для неискушенных и неподготовленных пользователей, которые включают следующее.

Цветной индикатор (красный или желтый свет)
Дисплей, показывающий фразу не удалось или же деградированный рядом с названием предмета
Измеритель с четко определенными зелеными, желтыми и красными полосами для нормального и неисправного
Звуковые сигналы, такие как зуммер, звонок или синтезированный голос

Действия по восстановлению и обслуживанию начинаются после получения уведомления.

Говорят, что предметы инструментированный когда уведомление происходит автоматически при сбое. Есть два подхода.

Сквозной (ETE)
Устройства самоотчета

Тестирование ETE включает в себя автоматизированный процесс, который периодически вводит что-то в элемент, а затем проверяются выходные данные, чтобы определить, соответствуют ли они уровню производительности, требуемому спецификацией. Это может быть навязчивым и может ненадолго помешать нормальной работе.

Устройства с самоотчетом включают в себя функции автоматического встроенного тестирования (BIT), которые менее навязчивы.

Элементы без уведомлений, подходящих для CBM, имеют режимы тихого отказа которые требуют периодического профилактического обслуживания.

Периодический

Вероятность сбоя в работе увеличивается с течением времени до тех пор, пока действия по диагностике или профилактическому обслуживанию не устранят любые фактические отказы.

Операционный отказ в конечном итоге произойдет, когда элемент используется в нормальном режиме работы, если не будет никакого вмешательства. Процедуры, связанные с периодическим обслуживанием, обычно называют Система периодического обслуживания (ПМС).

Существует риск того, что система не будет работать должным образом, и этот риск со временем растет из-за возрастающей возможности тихие неисправности которые вызывают сбой в работе.

Периодические действия по техническому обслуживанию снижают риск отказа в работе. Это связано с инвазивными процедурами, которые выводят систему из строя на короткий период, пока пользователи выполняют диагностические или профилактические процедуры вручную. Ниже приведены несколько примеров.

Калибровка
Встроенный тест (BIT)
Внешняя диагностика (приборы)
Системный рабочий тест (SOT)

Элемент не работает и недоступен для нормальной работы в то время, пока выполняется процедура периодического обслуживания.

Неудача статистическая. Существует случайная вероятность того, что система или элемент не будут работать, когда это необходимо. С течением времени надежность снижается, а вероятность отказа увеличивается до тех пор, пока не будут приняты меры.

Элемент в конечном итоге выйдет из строя, если не будет вмешательства.

Периодическое обслуживание все больше снижает риски эксплуатационных отказов, поскольку процедуры используются чаще. Средняя надежность повышается по мере сокращения времени между работами по техническому обслуживанию.

{ displaystyle Reliability = 0,5 times left (1 + e ^ { left (- lambda times Time Between Maintenance Actions right)} right)}

Например, элемент без функций CBM будет работать должным образом примерно 90% времени, если периодическое обслуживание выполняется примерно в 5 раз чаще, чем MTBF.

{ Displaystyle 0,9 примерно 0,5 раз влево (1 + е ^ {- 0,2} вправо)}

Локализация отказов

Локализация отказов это стратегия, используемая для определения основной причины сбоя. Есть два метода.

Автоматическое устранение неисправностей
Ручное устранение неисправностей

Автоматическое устранение неисправностей

Автоматическое устранение неисправностей определяет основную причину сбоя без ручного вмешательства.

Обычно это используется для управления избыточными элементами, когда необходимо автоматически обходить отказы.

Ручное устранение неисправностей

Ручное устранение неисправностей - это когда обслуживающий персонал должен определить основную причину неисправности. Обычно для этого требуется следующее.

Ручные диагностические тесты
Испытательное оборудование
Запчасти
Документация
Обучение персонала

Инструментарий устройства, используемый с CBM, обычно используется для сокращения времени и усилий, необходимых для выявления основной причины.

Корректирующее действие

Корректирующее действие - это действие, которое восстанавливает производительность элемента или системы после сбоя.

Есть два вида корректирующих действий.

Автоматический
Руководство

Автоматическое корректирующее действие

Автоматическое исправление возможно для резервированных систем, когда обнаружение неисправностей, изоляция неисправностей и обход неисправностей выполняются автоматически.

Автоматическое корректирующее действие также называется Активное восстановление и Самостоятельное исцеление.

Этот метод можно использовать для увеличения MTBF до периода времени, в течение которого элемент будет использоваться без обслуживания.

Например, ожидается отказ космических аппаратов, от которых может потребоваться правильная работа до 10 лет во враждебной среде.

Избыточность может быть достигнута за счет запуска большого количества спутников, что является практическим решением для таких вещей, как глобальная система позиционирования (GPS), поскольку каждое транспортное средство занимает немного другую орбиту.

Это невозможно для геостационарной орбиты, где все функции должны выполняться одним транспортным средством, которое выполняет все функции и должно сохранять устойчивое положение в одном конкретном месте на поверхности земли. Спутники, предназначенные для работы на геостационарной орбите, должны включать активное восстановление, которое предотвращает полный отказ в случае отказа одной или нескольких частей.

Автоматическое корректирующее действие включает все запасные части в конструкцию, чтобы учесть все отказы, которые можно ожидать в течение определенного периода времени.

Корректирующее действие вручную

Ручное корректирующее действие - это когда обученный обслуживающий персонал выполняет калибровку или замену для восстановления работы.

Корректирующие действия для избыточных элементов включают ручную реконфигурацию, когда автоматический обход неисправности недоступен, что зависит от обслуживания.

Замена неисправной детали зависит от Самый низкий заменяемый блок (LRU). Это может быть часть внутри предмета или целый предмет. Это решение принимается на основании того, что дешевле заменить.

Например, новый дисковод стоит около 200 долларов, техническая помощь по замене жесткого диска стоит 500 долларов, а отремонтированный компьютер стоит около 600 долларов. Если вы замените свой собственный диск и установите собственную операционную систему, то приобретение диска будет дешевле. Если вам нужна техническая помощь, дешевле заменить весь компьютер.

Оперативная проверка

Оперативная проверка любое действие, выполняемое для проверки работоспособности элемента или системы.

Обычно это включает использование системы в ее нормальном режиме работы, который может включать фактическую работу или имитацию работы.

Надежность

Техническое обслуживание тесно связано с надежностью, поскольку техническое обслуживание требуется для восстановления возможности, которая была потеряна из-за сбоя.

Распад электронных устройств математически эквивалентен радиоактивный распад процессы для нестабильных атомов.

Электронный отказ регулируется случайными процессами, где Среднее время наработки на отказ определяет среднее количество часов до отказа. Лямбда ${ displaystyle lambda}$ определяет количество сбоев, ожидаемых за час.

{ displaystyle lambda = { frac {1} {Среднее Время Between Failure}}}

Надежность - это вероятность того, что отказ не произойдет в течение определенного промежутка времени.

{ Displaystyle Надежность = е ^ { left (- lambda times Time right)}}

{ displaystyle Probability of Failure = 1-Reliability}

Коэффициент отказов основан на логарифмической математике для упрощения вычислений с использованием ${ displaystyle lambda}$ это очень похоже на тип анализа, используемый для электронных схем.

Общая частота отказов для сложного элемента - это сумма всех показателей отказов для всех отдельных компонентов в элементе. Это относится к ситуациям, когда отказ одного компонента приводит к отказу всего элемента. Тип расчета аналогичен последовательной электронной схеме.

{ displaystyle lambda = lambda _ {1} + lambda _ {2} + ... + lambda _ {n} = sum _ {k = 1} ^ {N} lambda _ {k}}

Общая частота отказов для элементов с полным дублированием является обратной величиной MTBF для всех отдельных избыточных элементов. Это относится к ситуациям, когда все компоненты в элементе должны выйти из строя, прежде чем элемент выйдет из строя. Тип расчета аналогичен параллельной электронной схеме.

{ displaystyle lambda = left ({ dfrac {1} {{ dfrac {1} { lambda _ {1}}} + { dfrac {1} { lambda _ {2}}} + .. . + { dfrac {1} { lambda _ {n}}}}} right) = left ({ dfrac {1} { sum _ {k = 1} ^ {N} { dfrac {1 } { lambda _ {k}}}}} right)}

А блок-схема надежности используется для построения модели для крупных предметов. Это обеспечивает прослеживаемость при определении потребностей в финансировании и рабочей силе с использованием расчетов надежности.

Частота отказов кремниевых и углеродных устройств удваивается для каждого ${ displaystyle 5 ^ {o}}$ Повышение температуры C. Электронные устройства, работающие на ${ displaystyle 60 ^ {o}}$ C будет выходить из строя в 64 раза чаще, чем аналогичные элементы, работающие на ${ displaystyle 30 ^ {o}}$ C. Это соотношение верно выше ${ displaystyle 25 ^ {o}}$ С.

Надежность транспортировки аналогична, но значения выражаются в единицах расстояния, например, количество отказов на милю или отказов на километр.

Интенсивность отказов может быть выражена количеством циклов. Тепловой удар, вызванный нагревом и охлаждением, может вызвать отказ при включении и выключении питания. Большинство механических переключателей рассчитаны на срабатывание 10 000 циклов до отказа, что составляет около 30 лет при частоте цикла 1 действие в день.

Надежность расстояния, цикла и затухания - все это имеет отдельные вклады, влияющие на общую интенсивность отказов.

Доступность

Доступность обычно используется с системами, которые включают периодическое обслуживание.

Доступность это вероятность того, что элемент будет работать правильно в течение определенного периода времени при случайном использовании в течение этого периода.

{ displaystyle Availability = { frac {Available Time} {Total Time}}}

{ displaystyle Total Time = Available Time + Down Time}

{ displaystyle Down Time = Maintenance Time + Faailed Time}

Доступное время время, когда система полностью работоспособна. Время простоя это время, в течение которого система недоступна для нормального использования, и состоит из времени, в течение которого выполняется периодическое обслуживание, и количества времени, в течение которого система находится в неисправном состоянии.

Расчеты доступности имеют смысл для элементов с заменяемыми частями, только когда режимы отказа имеют достаточный охват.

{ displaystyle Coverage> Доступность}

Готовность

Готовность имеет значение, когда элемент не требует простоя для периодического обслуживания. Это полезное измерение для элементов, которые включают автоматическое восстановление или техническое обслуживание на основе состояния.

Готовность это вероятность того, что элемент будет работать, как ожидалось, при использовании в любое случайное время, пока элемент находится в правильном режиме работы.

{ displaystyle Readiness = 1- lambda times Mean Time To Recover}

Среднее время восстановления, выполняемое вручную, обычно измеряется или оценивается. Ниже приведен пример значений, которые можно использовать для оценки механической части времени восстановления, связанной с заменой неисправной печатной платы.

Статический ремешок на запястье

120 секунд

Болты и винты с невыпадающей гайкой

убрать 15 секунд; заменить 30 секунд

Болты и винты с ослабленной гайкой

удалить 30 секунд; заменить 60 секунд

Маленькие кабели

отключить 15 секунд; переподключиться 60 секунд

Печатная карта

удалить 30 секунд; вставить 120 секунд

Расчеты готовности имеют смысл для элементов с заменяемыми частями, только когда режимы отказа имеют достаточный охват.

{ displaystyle Coverage> Готовность}

Покрытие

Покрытие обслуживания оценивает долю отказов, обнаруженных CBM и PMS.

{ displaystyle Coverage = { frac {Faults Detected By CBM + Faults Detected By PMS} {Total Possible Faults}}}

Приблизительную оценку покрытия можно сделать, наблюдая за соотношением между эксплуатационными отказами и действиями по техническому обслуживанию.

{ displaystyle Coverage приблизительно { frac {Total Faults Excluding Operational Failure} {Total Faults Including Operational Failure}}}

Расчеты доступности, расчеты готовности и связанные заявления действительны только в том случае, если покрытие превышает доступность.

Военные против коммерческих

Философия военного обслуживания против коммерческой.

Военные системы и крупные коммерческие системы имеют общие ограничения надежности.

Возможность для военной системы продолжать работу после боевых повреждений живучесть.

Политика военного содержания (MMP) требуется для систем защиты. Конструкции обычно включают в себя резервирование с автоматическим обнаружением неисправностей, автоматической изоляцией неисправностей и автоматическим обходом неисправностей. Эти системы изменяют конфигурацию без вмешательства человека после боевых повреждений и обычных отказов.

Большинство коммерческих готовых предметов (COTS) развертываются в благоприятных условиях, но электронные устройства не работают так же, как постоянные случайные повреждения в бою. Этот эффект усиливается с увеличением размера.

Чрезмерное время простоя - это разновидность дефект конструкции это влияет на все большие системы.

В качестве примера, если система построена из 1000 отдельных компьютеров, каждый со средней наработкой на отказ в 3 года, то среднее время безотказной работы всей системы составит 1 день. Если среднее время ремонта (MTTR) составляет 3 дня, то система никогда не будет работать.

Если одна и та же система включает 1010 компьютеров, то отказ будет редким, если система включает в себя автоматическое обнаружение сбоев, автоматическое устранение сбоев и автоматический обход сбоев.

Это показывает, почему большие коммерческие системы требуют той же философии обслуживания, что и военные системы.