Примечания к выпуску

Содержание

v1.4.0 Функции и улучшения Улучшенное качество поискаГибридный ключевой и семантический поискПоиск на уровне документаВстроенный выбор пресета базы знанийОбновление встроенной базы знаний во время апгрейдаСжатие истории беседРежим Agent Mode и загрузку инструментов MCP теперь можно настраивать независимоСоздание пользовательской базы знанийУлучшения Breaking Changes Known Limitations v1.3.1 Функции и улучшения Инструмент BYO KnowledgeПоддержка Multi-ClusterОграничения квот токеновИсторияУлучшения Исправления ошибок v1.2.1 Исправления ошибок Улучшения v1.2.0 Функции и улучшения Известные проблемы

v1.4.0

Функции и улучшения

Улучшенное качество поиска

Встроенная база знаний была пере-embedded с использованием более мощной модели, что существенно улучшило релевантность ответов — в том числе при кросс-языковом поиске (например, когда вопрос задается на китайском языке по англоязычной документации). Существующие развертывания v1.3.x автоматически мигрируются во время обновления — см. Руководство по обновлению.

Гибридный ключевой и семантический поиск

Теперь ответы извлекаются с использованием комбинации семантического сходства и сопоставления по ключевым словам, после чего результаты объединяются в единый рейтинг. Это позволяет находить точные совпадения по ключевым словам, которые пропускает чисто семантический поиск, — такие как имена CRD, флаги команд и строки ошибок, — не теряя при этом возможности отвечать на вопросы на естественном языке.

Поиск на уровне документа

Теперь каждый документ индексируется не только по своим разделам, но и на уровне всего документа. Вопросы об общей теме документа теперь находят нужный документ даже тогда, когда формулировка пользователя не пересекается ни с одним конкретным абзацем.

Встроенный выбор пресета базы знаний

На странице установки теперь можно выбрать один из двух пресетов для встроенной базы знаний. Значение по умолчанию хорошо подходит для большинства запросов; более крупный пресет может давать немного лучший recall для вопросов, охватывающих длинные документы.

Обновление встроенной базы знаний во время апгрейда

При обновлении с v1.3.x до v1.4.x встроенная продуктовая база знаний заменяется новым дампом с GTE-embedded и автоматически мигрируются метаданные на уровне документов. Никаких ручных шагов по экспорту, импорту базы данных или перезапуску не требуется — см. Руководство по обновлению. Пользовательские и BYO базы знаний этим шагом не затрагиваются (см. разделы Breaking Changes и Known Limitations ниже).

Сжатие истории бесед

Длинные беседы автоматически суммируются, чтобы они помещались в окно контекста LLM без потери ранних сообщений. Это снижает стоимость токенов в длительных сессиях agent-mode и позволяет пользователям продолжать исследование в большом количестве сообщений без ухудшения качества.

Режим Agent Mode и загрузку инструментов MCP теперь можно настраивать независимо

Режим Agent Mode (многошаговое рассуждение) и загрузка инструментов ACP MCP теперь управляются раздельными переключателями установки. Вы можете включить Agent Mode без загрузки инструментов ACP MCP — например, когда LLM должен строить план только на основе встроенной базы знаний, — и снова включить инструменты, когда требуются операции с живым кластером.

Создание пользовательской базы знаний

Новое руководство помогает администраторам загружать внутренние Git-репозитории в базу знаний Hyperflux, чтобы Hyperflux мог отвечать на вопросы, основанные на внутренних runbooks, проектной документации и других внутренних источниках. См. Создание пользовательской базы знаний.

Улучшения

Снижена стоимость токенов для ответов в agent-mode, когда инструменты возвращают большой объем вывода (например, логи или крупные определения ресурсов).
Улучшена производительность хранилища для базы данных встроенной базы знаний.

Breaking Changes

Пользовательские базы знаний, созданные в v1.3.x, необходимо перестроить перед обновлением. Новая модель embedding несовместима с предыдущей, поэтому существующие данные пользовательского корпуса не будут доступны до пересборки. См. руководство Создание пользовательской базы знаний для нового порядка действий.

Known Limitations

Документы, загруженные через инструмент BYO Knowledge, сохраняются без изменений при обновлении до v1.4.0 — обновляется только встроенная продуктовая база знаний.

v1.3.1

Функции и улучшения

Инструмент BYO Knowledge

Инструмент BYO Knowledge позволяет организациям импортировать приватные знания и использовать их как выделенный, доступный для поиска источник знаний при ответах на вопросы. Это помогает командам формировать ответы на основе внутренних документов, операционных знаний и контекста, специфичного для организации.

Поддержка Multi-Cluster

Поддержка Multi-Cluster позволяет пользователям получать доступ к информации из нескольких кластеров по имени кластера, расширяя возможности question-answering за пределы границ одного кластера. Это упрощает запрос и сравнение ресурсов в разных кластерных средах.

Ограничения квот токенов

Ограничения квот токенов позволяют ограничивать частоту запросов и использование токенов на уровне пользователя. Это помогает администраторам контролировать затраты, управлять квотами и предотвращать чрезмерное потребление ресурсов модели.

История

Поддержка истории позволяет пользователям просматривать предыдущие беседы и результаты question-answering. Это упрощает отслеживание контекста, продолжение ранее начатых исследований и устранение проблем на основе прошлых взаимодействий.

Улучшения

Оптимизированы процесс RAG (langchain) и reranking, что значительно повысило точность и релевантность ответов.
Обновлен основной AI framework до LangChain 1.0 для совместимости с последними возможностями и оптимизациями.
Добавлены регулярные prompts системной проверки, а также выполнена комплексная полировка кода и linting unit test.
Разделены базы данных для системной базы знаний, пользовательской базы знаний и истории чатов, чтобы улучшить изоляцию данных и производительность.
Переработана страница взаимодействия Smart Doc для более интуитивного и эффективного пользовательского опыта.
Обновлен MCP server, добавлена поддержка OAuth authentication и настраиваемых записываемых конфигураций инструментов.
Улучшена интеграция загрузки файлов для более плавного процесса ingestion знаний.
Добавлена поддержка IDs в custom elements и устранены связанные проблемы с избыточностью данных.
Реализован Redis-based rate limiter для повышения стабильности системы и управления API-трафиком.

Исправления ошибок

Исправлена проблема, из-за которой загрузка модели могла завершаться сбоем, и улучшена настройка переменных окружения для embedding models.
Устранены ошибки обработки данных, возникавшие при объединении и распаковке значений обновления.
Исправлена ошибка, вызывавшая избыточные префиксы данных в custom elements.
Устранены периодические сбои вызовов сервисов для повышения общей надежности системы.

v1.2.1

ПРИМЕЧАНИЕ: Agent mode — экспериментальная функция, используйте с осторожностью.

Исправления ошибок

Исправлена проблема, из-за которой задание имени базы знаний могло не работать. Это исправление добавляет возможность задавать имя файла дампа базы данных во время установки и автоматически использовать указанный файл дампа базы данных для инициализации базы знаний.
Исправлена проблема, из-за которой инструменты MCP могли создавать или удалять ресурсы K8s без подтверждения человека в режиме Agent mode.
Исправлена проблема, при которой при запросе информации о свободном месте на диске с использованием Agent mode сервер мог зависать.
Исправлена проблема, возникавшая при развертывании на ACP 4.2 или выше, когда не обрабатывались taints узлов по умолчанию.
Исправлена ошибка развертывания: kubeVersion: >=1.20.0 which is incompatible with Kubernetes v1.33.7-1.
Исправлена проблема, при которой API key для LLM service и rerank service отображался в открытом виде при развертывании.

Улучшения

Улучшен prompt для корректной идентификации Hyperflux.
Удалены неиспользуемые элементы конфигурации на странице установки.

v1.2.0

Функции и улучшения

По умолчанию для ответов на вопросы пользователей используется RAG chain, что повышает точность ответов.
Поддержан импорт дампа базы данных для инициализации базы знаний, что упрощает процесс настройки.
Экспериментально: поддержано включение режима Agent mode для использования инструментов MCP и получения информации о кластере в реальном времени.
Поддержано подключение к базе данных PGVector, развернутой вне установки Alauda Hyperflux.
Поддержана модель Cohere Reranker для повышения релевантности ответов.
Поддержана настройка параметров RAG chain, таких как total_search_k и т. д.

Известные проблемы

При возникновении ошибок со стороны LLM формирование ответа может завершиться неудачей. При возврате к просмотру истории чата запрос будет снова отправлен в LLM, что приведет к дублированию бесед.

#Примечания к выпуску

#Содержание

#v1.4.0

#Функции и улучшения

#Улучшенное качество поиска

#Гибридный ключевой и семантический поиск

#Поиск на уровне документа

#Встроенный выбор пресета базы знаний

#Обновление встроенной базы знаний во время апгрейда

#Сжатие истории бесед

#Режим Agent Mode и загрузку инструментов MCP теперь можно настраивать независимо

#Создание пользовательской базы знаний

#Улучшения

#Breaking Changes

#Known Limitations

#v1.3.1

#Функции и улучшения

#Инструмент BYO Knowledge

#Поддержка Multi-Cluster

#Ограничения квот токенов

#История

#Улучшения

#Исправления ошибок

#v1.2.1

#Исправления ошибок

#Улучшения

#v1.2.0

#Функции и улучшения

#Известные проблемы

Примечания к выпуску

Содержание

v1.4.0

Функции и улучшения

Улучшенное качество поиска

Гибридный ключевой и семантический поиск

Поиск на уровне документа

Встроенный выбор пресета базы знаний

Обновление встроенной базы знаний во время апгрейда

Сжатие истории бесед

Режим Agent Mode и загрузку инструментов MCP теперь можно настраивать независимо

Создание пользовательской базы знаний

Улучшения

Breaking Changes

Known Limitations

v1.3.1

Функции и улучшения

Инструмент BYO Knowledge

Поддержка Multi-Cluster

Ограничения квот токенов

История

Улучшения

Исправления ошибок

v1.2.1

Исправления ошибок

Улучшения

v1.2.0

Функции и улучшения

Известные проблемы