Настройка MachineHealthCheck

Содержание

Обзор Предварительные требования Настройка MachineHealthCheck для MachineDeployment Настройка MachineHealthCheck для узлов control plane Справка

Обзор

MachineHealthCheck — это ресурс в Cluster API, который позволяет пользователям определять условия, при которых Machines в кластере следует считать неисправными. MachineHealthCheck задается в управляющем кластере и применяется к конкретному кластеру рабочих нагрузок.

При создании MachineHealthCheck пользователи указывают тайм-аут для каждого из условий, которые они определяют для проверки Node машины. Если любое из этих условий сохраняется в течение указанного тайм-аута, для Machine будет выполнено восстановление. По умолчанию действие восстановления Machine должно инициировать создание новой Machine для замены отказавшей, однако провайдеры могут подключать более сложные внешние решения для восстановления.

WARNING

MachineHealthCheck использует механизм rolling update в Cluster API. Во время rolling update все ранее подключенные диски удаляются и заменяются новыми дисками на вновь созданных машинах. Убедитесь, что никакие функции кластера или рабочие нагрузки не зависят от данных, хранящихся на исходных дисках.

Предварительные требования

Прежде чем пытаться настроить MachineHealthCheck, у вас должен быть рабочий управляющий кластер, в котором развернут как минимум один MachineDeployment или KubeadmControlPlane.