В этом документе приведено пошаговое руководство по настройке внешнего доступа к вашим сервисам инференса, включая проверку адресов внешнего доступа, создание доменов, настройку балансировщиков нагрузки и проверку конфигурации.
Вы можете:
status.url.В консоли администратора перейдите в Network > Domains, затем нажмите Create Domain.
(Один балансировщик нагрузки может использоваться несколькими проектами; создавайте новый только при необходимости.)
В консоли администратора перейдите в Network > Load Balancers, затем нажмите Create Load Balancer. Для подробной справочной документации обратитесь к .
В консоли Alauda Container Platform перейдите в Network > Load Balancers, затем нажмите на имя только что созданного балансировщика нагрузки, чтобы открыть страницу его конфигурации.
Добавьте порты прослушивания для вашего сервиса. При необходимости можно добавить несколько портов.
Шаг 1: Добавить порт
80. Для HTTPS — 443.Шаг 2: Настройка HTTPS (если применимо)
Если выбран протокол HTTPS, необходимо выбрать сертификат по умолчанию.
istio-system. Это важно для следующего шага.knative-serving-cert в качестве Default Certificate.Настройте правила переадресации для добавленных портов.
Шаг 1: Добавить правило
qwen2-0b5-kubeflow-admin-cpaas-io.my-company.com.Шаг 2: Настройка группы сервисов
istio-system. Если нет, сначала переключите пространство имён вашего проекта на istio-system.knative-ingressgateway из выпадающего списка.Примечание: Процесс настройки правил для протокола HTTPS (порт 443) аналогичен описанному выше.
Для более подробной настройки параметров вы можете обратиться к .
Чтобы проверить, доступен ли ваш сервис инференса извне, используйте команду curl ниже. Не забудьте заменить заполнители на фактический IP-адрес балансировщика нагрузки, порт и адрес сервиса инференса.
Вот что означает каждая часть команды и что нужно заменить:
your-inference-service-domain.com: доменное имя, созданное для вашего сервиса инференса (например, qwen2-0b5-kubeflow-admin-cpaas-io.my-company.com).your-port: порт, на котором ваш балансировщик нагрузки слушает HTTP-трафик (обычно 80).your-load-balancer-ip: фактический IP-адрес вашего балансировщика нагрузки (например, 192.168.137.21).Если запрос успешно возвращает список моделей, ваша конфигурация завершена! Если нет, проверьте настройки балансировщика нагрузки или просмотрите логи сервиса инференса для выявления проблемы.