Русский

Обновление глобального кластера

состоит из глобального кластера и одного или нескольких рабочих кластеров. Глобальный кластер обязательно должен быть обновлён перед любыми рабочими кластерами.

В этом документе описана процедура обновления глобального кластера.

Если глобальный кластер настроен с решением global DR (Disaster Recovery), строго следуйте процедуре global DR. В противном случае следуйте Стандартной процедуре.

Содержание

Стандартная процедура

Загрузка образов

Скопируйте основной пакет на любой узел управляющей плоскости глобального кластера. Распакуйте пакет и перейдите в распакованную директорию.

Если глобальный кластер использует встроенный реестр, выполните:
```
bash upgrade.sh --only-sync-image=true
```
Если глобальный кластер использует внешний реестр, необходимо также указать адрес реестра:
```
bash upgrade.sh --only-sync-image=true --registry <registry-address> --username <username> --password <password>
```

Если вы планируете обновлять Operator и Cluster Plugin одновременно с обновлением глобального кластера, вы можете заранее загрузить их образы в реестр глобального кластера. Инструкции по массовой загрузке см. в разделе Push only images from all packages in a directory.

INFO

Загрузка образов обычно занимает около 2 часов, в зависимости от вашей сети и производительности диска.

Если ваша платформа настроена для глобального аварийного восстановления (DR), помните, что резервный глобальный кластер также требует загрузки образов. Планируйте окно обслуживания соответственно.

WARNING

При использовании violet для загрузки пакетов в резервный кластер необходимо указать параметр --dest-repo <VIP addr of standby cluster>.
В противном случае пакеты будут загружены в репозиторий образов основного кластера, что помешает резервному кластеру устанавливать или обновлять расширения.

Также обратите внимание, что необходимо предоставить либо данные аутентификации реестра образов резервного кластера, либо параметр --no-auth.

Подробности по подкоманде violet push смотрите в разделе Upload Packages.

Запуск обновления

После завершения загрузки образов выполните следующую команду для запуска процесса обновления:

bash upgrade.sh --skip-sync-image

Дождитесь завершения скрипта перед продолжением.

Если вы заранее загрузили образы Operator и Cluster Plugin в реестр глобального кластера, затем можете выполнить Create only CRs from all packages in a directory. После выполнения этой команды подождите около 10–15 минут, пока не появятся уведомления об обновлении функциональных компонентов. После этого вы сможете обновить Operator и Cluster Plugin вместе в следующих шагах обновления.

WARNING

При обновлении глобального кластера не используйте параметр --clusters для создания CR в рабочих кластерах на шаге Create only CRs from all packages in a directory. Это может привести к сбоям обновления при последующем обновлении рабочих кластеров.
Если вы обновляетесь с версии 3.18 или 4.0 и в директории содержится пакет Build of TopoLVM, его необходимо удалить до выполнения шага Create only CRs from all packages in a directory. После этого создайте CR для TopoLVM отдельно, обязательно указав параметр --target-catalog-source "platform".

(Условно) Удаление TopoLVM

Если вы обновляетесь с версии 3.18 и установлен пакет Build of TopoLVM, необходимо сделать резервную копию и удалить связанные ресурсы TopoLVM перед продолжением обновления.

В противном случае обновление кластера завершится неудачей.

Выполните следующие команды на любом узле управляющей плоскости обновляемого кластера:

kubectl get artifactversion -n cpaas-system  $(kubectl get artifactversion -n cpaas-system -l cpaas.io/artifact-version=operatorhub-topolvm-operator --no-headers | grep 4.1 | head -1 | awk '{print $1}') -o yaml > topolvm-artifact.yaml
kubectl delete -f topolvm-artifact.yaml

Затем выполните следующую команду на любом узле управляющей плоскости глобального кластера:

# Замените cluster_name на имя обновляемого кластера
kubectl delete minfo $(kubectl get minfo | grep topolvm-migrate-catalog-updater | grep $cluster_name | awk '{print $1}')

Обновление глобального кластера

ВНИМАНИЕ

Если вы обновляетесь с версии 3.16 или 3.18 и на платформе установлены Data Services, необходимо также обновить соответствующие расширения при обновлении кластеров.

Подробнее см. в разделе Upgrade Data Services.

Войдите в Web Console глобального кластера и переключитесь в режим Administrator.
Перейдите в раздел Clusters > Clusters.
Нажмите на кластер global для открытия его подробного просмотра.
Перейдите на вкладку Functional Components.
Нажмите кнопку Upgrade.

Ознакомьтесь с доступными обновлениями компонентов в диалоговом окне и подтвердите продолжение.

INFO

Обновление версии Kubernetes является необязательным. Однако, поскольку возможны перебои в работе сервиса в любом случае, рекомендуется включить обновление Kubernetes, чтобы избежать нескольких окон обслуживания.
Если в глобальном кластере установлен Alauda Container Platform GitOps, и после обновления плагины работают некорректно, обратитесь к разделу Upgrading Alauda Container Platform GitOps.

(Условно) Обновление TopoLVM

Если вы обновляетесь с версии 3.18, установлен пакет Build of TopoLVM и вы уже выполнили шаг Удаление TopoLVM.

На узле управляющей плоскости обновляемого кластера выполните команду для обновления TopoLVM:

kubectl create -f topolvm-artifact.yaml

После выполнения команды подождите примерно 5–10 минут. Компонент TopoLVM будет автоматически обновлён и отражён в веб-консоли.

Установка плагина Product Docs

INFO

Плагин Alauda Container Platform Product Docs обеспечивает доступ к документации продукта внутри платформы. Все ссылки на справку в платформе будут вести к этой документации. Если плагин не установлен, при нажатии на ссылки справки в платформе будет возникать ошибка 404.

Начиная с версии ACP 4.0, встроенная документация продукта выделена в отдельный плагин Alauda Container Platform Product Docs. Если вы обновляетесь с версии 3.18, необходимо установить этот плагин, выполнив следующие шаги:

Перейдите в раздел Administrator.
В левой боковой панели выберите Marketplace > Cluster Plugins и выберите кластер global.
Найдите плагин Alauda Container Platform Product Docs и нажмите Install.

Установка плагина Alauda Container Platform Cluster Enhancer

INFO

Этот шаг необходим только для проверки установки плагина cluster enhancer. Если плагин уже установлен, ничего делать не нужно.

Перейдите в раздел Administrator.
В левой боковой панели выберите Marketplace > Cluster Plugins и выберите кластер global.
Найдите плагин Alauda Container Platform Cluster Enhancer и нажмите Install.

(Условно) Установка Service Mesh Essentials

Если установлен Service Mesh v1, перед обновлением рабочих кластеров обратитесь к документации .

После обновления

Процедура global DR

Проверка согласованности данных

Следуйте вашим стандартным процедурам проверки global DR, чтобы убедиться, что данные в резервном глобальном кластере согласованы с данными основного глобального кластера.

Если обнаружены несоответствия, свяжитесь с технической поддержкой перед продолжением.

На обоих кластерах выполните команду, чтобы убедиться, что нет узлов Machine в состоянии, отличном от работающего:

kubectl get machines.platform.tkestack.io

Если такие узлы есть, обратитесь в техническую поддержку для их устранения перед продолжением.

Удаление плагина синхронизации etcd

Обновление с 3.18

Зайдите в Web Console основного кластера по его IP или VIP.
Переключитесь в режим Administrator.
Перейдите в Catalog > Cluster Plugin.
Выберите global в выпадающем списке кластеров.
Найдите плагин EtcdSync и нажмите Uninstall. Дождитесь завершения удаления.

Загрузка образов

Выполните шаг Загрузка образов на обоих кластерах — резервном и основном.

Подробности см. в разделе Загрузка образов в Стандартной процедуре.

Обновление резервного кластера

INFO

Для выполнения обновления необходим доступ к Web Console резервного кластера.

Перед началом убедитесь, что ресурс ProductBase резервного кластера корректно настроен с VIP кластера в поле spec.alternativeURLs.

Если нет, обновите конфигурацию следующим образом:

apiVersion: product.alauda.io/v1alpha2
kind: ProductBase
metadata:
  name: base
spec:
  alternativeURLs:
    - https://<standby-cluster-vip>

На резервном кластере выполните шаги из Стандартной процедуры для завершения обновления.

Обновление основного кластера

После обновления резервного кластера выполните Стандартную процедуру на основном кластере.

Переустановка плагина синхронизации etcd

Перед переустановкой убедитесь, что порт 2379 корректно проброшен с VIP обоих глобальных кластеров на их узлы управляющей плоскости.

Для переустановки:

Зайдите в Web Console резервного глобального кластера по его IP или VIP.
Переключитесь в режим Administrator.
Перейдите в Marketplace > Cluster Plugins.
Выберите кластер global.
Найдите Alauda Container Platform etcd Synchronizer, нажмите Install и укажите необходимые параметры.

Для проверки установки выполните:

kubectl get po -n cpaas-system -l app=etcd-sync  # Убедитесь, что pod в состоянии 1/1 Running

kubectl logs -n cpaas-system $(kubectl get po -n cpaas-system -l app=etcd-sync --no-headers | awk '{print $1}' | head -1) | grep -i "Start Sync update"
# Дождитесь появления в логах строки "Start Sync update"

# Пересоздайте pod для запуска синхронизации ресурсов с ownerReferences
kubectl delete po -n cpaas-system $(kubectl get po -n cpaas-system -l app=etcd-sync --no-headers | awk '{print $1}' | head -1)

Проверка статуса синхронизации

Выполните следующую команду для проверки статуса синхронизации:

curl "$(kubectl get svc -n cpaas-system etcd-sync-monitor -ojsonpath='{.spec.clusterIP}')/check"

Объяснение вывода:

"LOCAL ETCD missed keys:" – Ключи присутствуют в основном кластере, но отсутствуют в резервном. Обычно решается после перезапуска pod.
"LOCAL ETCD surplus keys:" – Ключи присутствуют в резервном кластере, но отсутствуют в основном. Перед удалением проконсультируйтесь с вашей операционной командой.

Просмотреть полную документацию в формате PDF

Обновление глобального кластера

В этом документе описана процедура обновления глобального кластера.

Содержание

Стандартная процедура

Загрузка образов

Если глобальный кластер использует встроенный реестр, выполните:
```
bash upgrade.sh --only-sync-image=true
```
Если глобальный кластер использует внешний реестр, необходимо также указать адрес реестра:
```
bash upgrade.sh --only-sync-image=true --registry <registry-address> --username <username> --password <password>
```

INFO

Загрузка образов обычно занимает около 2 часов, в зависимости от вашей сети и производительности диска.

WARNING

Подробности по подкоманде violet push смотрите в разделе Upload Packages.

Запуск обновления

После завершения загрузки образов выполните следующую команду для запуска процесса обновления:

bash upgrade.sh --skip-sync-image

Дождитесь завершения скрипта перед продолжением.

WARNING

При обновлении глобального кластера не используйте параметр --clusters для создания CR в рабочих кластерах на шаге Create only CRs from all packages in a directory. Это может привести к сбоям обновления при последующем обновлении рабочих кластеров.
Если вы обновляетесь с версии 3.18 или 4.0 и в директории содержится пакет Build of TopoLVM, его необходимо удалить до выполнения шага Create only CRs from all packages in a directory. После этого создайте CR для TopoLVM отдельно, обязательно указав параметр --target-catalog-source "platform".

(Условно) Удаление TopoLVM

В противном случае обновление кластера завершится неудачей.

Выполните следующие команды на любом узле управляющей плоскости обновляемого кластера:

kubectl get artifactversion -n cpaas-system  $(kubectl get artifactversion -n cpaas-system -l cpaas.io/artifact-version=operatorhub-topolvm-operator --no-headers | grep 4.1 | head -1 | awk '{print $1}') -o yaml > topolvm-artifact.yaml
kubectl delete -f topolvm-artifact.yaml

Затем выполните следующую команду на любом узле управляющей плоскости глобального кластера:

# Замените cluster_name на имя обновляемого кластера
kubectl delete minfo $(kubectl get minfo | grep topolvm-migrate-catalog-updater | grep $cluster_name | awk '{print $1}')

Обновление глобального кластера

ВНИМАНИЕ

Подробнее см. в разделе Upgrade Data Services.

Войдите в Web Console глобального кластера и переключитесь в режим Administrator.
Перейдите в раздел Clusters > Clusters.
Нажмите на кластер global для открытия его подробного просмотра.
Перейдите на вкладку Functional Components.
Нажмите кнопку Upgrade.

Ознакомьтесь с доступными обновлениями компонентов в диалоговом окне и подтвердите продолжение.

INFO

Обновление версии Kubernetes является необязательным. Однако, поскольку возможны перебои в работе сервиса в любом случае, рекомендуется включить обновление Kubernetes, чтобы избежать нескольких окон обслуживания.
Если в глобальном кластере установлен Alauda Container Platform GitOps, и после обновления плагины работают некорректно, обратитесь к разделу Upgrading Alauda Container Platform GitOps.

(Условно) Обновление TopoLVM

Если вы обновляетесь с версии 3.18, установлен пакет Build of TopoLVM и вы уже выполнили шаг Удаление TopoLVM.

На узле управляющей плоскости обновляемого кластера выполните команду для обновления TopoLVM:

kubectl create -f topolvm-artifact.yaml

Установка плагина Product Docs

INFO

Перейдите в раздел Administrator.
В левой боковой панели выберите Marketplace > Cluster Plugins и выберите кластер global.
Найдите плагин Alauda Container Platform Product Docs и нажмите Install.

Установка плагина Alauda Container Platform Cluster Enhancer

INFO

Перейдите в раздел Administrator.
В левой боковой панели выберите Marketplace > Cluster Plugins и выберите кластер global.
Найдите плагин Alauda Container Platform Cluster Enhancer и нажмите Install.

(Условно) Установка Service Mesh Essentials

Если установлен Service Mesh v1, перед обновлением рабочих кластеров обратитесь к документации .

После обновления

Процедура global DR

Проверка согласованности данных

Если обнаружены несоответствия, свяжитесь с технической поддержкой перед продолжением.

kubectl get machines.platform.tkestack.io

Если такие узлы есть, обратитесь в техническую поддержку для их устранения перед продолжением.

Удаление плагина синхронизации etcd

Обновление с 3.18

Зайдите в Web Console основного кластера по его IP или VIP.
Переключитесь в режим Administrator.
Перейдите в Catalog > Cluster Plugin.
Выберите global в выпадающем списке кластеров.
Найдите плагин EtcdSync и нажмите Uninstall. Дождитесь завершения удаления.

Загрузка образов

Выполните шаг Загрузка образов на обоих кластерах — резервном и основном.

Подробности см. в разделе Загрузка образов в Стандартной процедуре.

Обновление резервного кластера

INFO

Для выполнения обновления необходим доступ к Web Console резервного кластера.

Если нет, обновите конфигурацию следующим образом:

apiVersion: product.alauda.io/v1alpha2
kind: ProductBase
metadata:
  name: base
spec:
  alternativeURLs:
    - https://<standby-cluster-vip>

На резервном кластере выполните шаги из Стандартной процедуры для завершения обновления.

Обновление основного кластера

После обновления резервного кластера выполните Стандартную процедуру на основном кластере.

Переустановка плагина синхронизации etcd

Для переустановки:

Зайдите в Web Console резервного глобального кластера по его IP или VIP.
Переключитесь в режим Administrator.
Перейдите в Marketplace > Cluster Plugins.
Выберите кластер global.
Найдите Alauda Container Platform etcd Synchronizer, нажмите Install и укажите необходимые параметры.

Для проверки установки выполните:

kubectl get po -n cpaas-system -l app=etcd-sync  # Убедитесь, что pod в состоянии 1/1 Running

kubectl logs -n cpaas-system $(kubectl get po -n cpaas-system -l app=etcd-sync --no-headers | awk '{print $1}' | head -1) | grep -i "Start Sync update"
# Дождитесь появления в логах строки "Start Sync update"

# Пересоздайте pod для запуска синхронизации ресурсов с ownerReferences
kubectl delete po -n cpaas-system $(kubectl get po -n cpaas-system -l app=etcd-sync --no-headers | awk '{print $1}' | head -1)

Проверка статуса синхронизации

Выполните следующую команду для проверки статуса синхронизации:

curl "$(kubectl get svc -n cpaas-system etcd-sync-monitor -ojsonpath='{.spec.clusterIP}')/check"

Объяснение вывода:

"LOCAL ETCD missed keys:" – Ключи присутствуют в основном кластере, но отсутствуют в резервном. Обычно решается после перезапуска pod.
"LOCAL ETCD surplus keys:" – Ключи присутствуют в резервном кластере, но отсутствуют в основном. Перед удалением проконсультируйтесь с вашей операционной командой.

ACP CLI (ac)

Управление узлами

Управляемые кластеры

Импорт кластеров

Инициализация кластера в публичном облаке

Инициализация сети

Инициализация хранилища

Как сделать

Как сделать

Управление резервным копированием

Управление восстановлением

Архитектура

Основные понятия

Руководства

Как сделать

ALB

Устранение неполадок

Основные понятия

Руководства

Как сделать

Устранение неполадок

Установка

Основные понятия

Руководства

Как сделать

Восстановление после сбоев

Основные понятия

Руководства

Как сделать

Руководства

Как сделать

Соответствие требованиям

Как сделать

API Refiner

Пользователь

Руководства

Группа

Руководства

Роль

Руководства

IDP

Руководства

Устранение неполадок

Политика пользователя

Руководства

Обзор

Образы

Руководства

Как сделать

Виртуальная машина

Руководства

Как сделать

Устранение неполадок

Сеть

Руководства

Как сделать

Хранение данных

Руководства

Резервное копирование и восстановление

Руководства

Основные понятия

Пространства имён

Создание приложений

Эксплуатация и сопровождение приложений

Развертывание приложений

KEDA (Kubernetes Event-driven Autoscaling)

Как сделать

Рабочие нагрузки

Конфигурации

Наблюдаемость приложения

Как сделать

Как сделать

Установка

Руководство пользователя

Обзор

Установка

Обновление

Руководства

Как сделать

Основные понятия