Обзор
Alauda Container Platform предоставляет два типа операций резервного копирования и восстановления:
- Резервное копирование и восстановление кластера: Резервное копирование и восстановление данных управляющей плоскости, включая etcd, registry, logging и monitoring.
- Резервное копирование и восстановление приложений: Резервное копирование и восстановление приложений и их постоянных томов на основе Velero.
Содержание
Резервное копирование и восстановление кластераРезервное копирование и восстановление etcdРезервное копирование и восстановление registryРезервное копирование и восстановление loggingРезервное копирование и восстановление monitoringРезервное копирование и восстановление приложенийАрхитектураУстановка приложенияРезервное копирование и восстановление приложенийОсобенности резервного копированияImmutable OS кластерыСценарии использованияРезервное копирование и восстановление в текущем кластереМежкластерная миграция приложенийРезервное копирование и восстановление кластера
Резервное копирование кластера защищает состояние управляющей плоскости и данные платформы.
Резервное копирование и восстановление etcd
etcd — это key-value хранилище для Alauda Container Platform, которое сохраняет состояние всех объектов ресурсов. Резервное копирование etcd играет ключевую роль в аварийном восстановлении.
Подробные инструкции см. в разделе etcd Backup and Restore.
Резервное копирование и восстановление registry
Для резервного копирования и восстановления registry см. Alauda Container Platform Registry Data Backup and Recovery.
Резервное копирование и восстановление logging
В настоящее время поддерживается ClickHouse. Обратитесь в техническую поддержку.
Резервное копирование и восстановление monitoring
Для резервного копирования и восстановления monitoring см. VictoriaMetrics Backup and Recovery.
Резервное копирование и восстановление приложений
В качестве администратора кластера вы можете выполнять резервное копирование и восстановление приложений, работающих на Alauda Container Platform, с помощью Velero.
Архитектура
Резервное копирование и восстановление приложений состоит из двух компонентов:
- Alauda Container Platform Data Backup Essentials: Обеспечивает UI и устанавливается на глобальном кластере.
- Alauda Container Platform Data Backup for Velero: Обеспечивает Velero и устанавливается на рабочих кластерах.
Установка приложения
Чтобы включить резервное копирование и восстановление приложений:
- Скачайте Alauda Container Platform Data Backup Essentials и Alauda Container Platform Data Backup for Velero с Customer Portal.
- Загрузите пакеты на платформу.
- Установите Data Backup Essentials на глобальном кластере.
- Установите Data Backup for Velero на рабочих кластерах.
После установки настройте репозиторий резервных копий для хранения данных резервного копирования.
Резервное копирование и восстановление приложений
Резервное копирование приложений выполняется созданием расписаний резервного копирования, а восстановление — выполнением задач восстановления.
Подробные инструкции см.:
Особенности резервного копирования
Перед настройкой политик резервного копирования учитывайте следующие архитектурные факторы, влияющие на стратегии резервного копирования и восстановления.
Immutable OS кластеры
Для кластеров, работающих на Immutable OS, VM Snapshot не требуется и не рекомендуется в качестве стратегии резервного копирования для сценариев аварийного восстановления.
Почему VM Snapshot не рекомендуется:
- Дизайн Immutable OS: Слой операционной системы является только для чтения и управляется централизованно платформой. При сбое узла платформа автоматически создает новый узел с правильной конфигурацией.
- Распределенный характер системы: Kubernetes — распределенная система. VM Snapshot не может захватить согласованное состояние распределенных компонентов, таких как кворум etcd.
- Ограничения аварийного восстановления: VM Snapshot обычно хранится вместе с исходными данными и не может справиться с катастрофами на уровне площадки.
Рекомендуемый подход к резервному копированию:
- Состояние кластера: Используйте резервные копии etcd для сохранения состояния управляющей плоскости
- Данные приложений: Используйте снимки PV или Restic для постоянных томов
- Конфигурация кластера: Используйте GitOps/IaC для управления конфигурацией
Сценарии использования
Резервное копирование и восстановление в текущем кластере
Восстановление приложений в текущем кластере после случайного удаления или сбоя. Обычно ресурсы приложений не требуют изменений во время восстановления.
Межкластерная миграция приложений
Типичные сценарии включают:
- Разработка и тестирование между дата-центрами
- Миграция ресурсов между кластерами
- Репликация из production в development/testing кластеры
Особенности:
- Обеспечьте схожие характеристики CPU и памяти между исходным и целевым кластерами
- Поддерживайте одинаковые сетевые режимы, чтобы избежать проблем с восстановлением ресурсов
- Если подсети отличаются, IP-адреса pod изменятся после восстановления
- Оцените необходимость миграции образов перед восстановлением данных