Примечания к выпуску
Содержание
v1.4.0Функции и улучшенияУлучшенное качество поискаГибридный ключевой и семантический поискПоиск на уровне документаВстроенный выбор пресета базы знанийОбновление встроенной базы знаний во время апгрейдаСжатие истории беседРежим Agent Mode и загрузку инструментов MCP теперь можно настраивать независимоСоздание пользовательской базы знанийУлучшенияBreaking ChangesKnown Limitationsv1.3.1Функции и улучшенияИнструмент BYO KnowledgeПоддержка Multi-ClusterОграничения квот токеновИсторияУлучшенияИсправления ошибокv1.2.1Исправления ошибокУлучшенияv1.2.0Функции и улучшенияИзвестные проблемыv1.4.0
Функции и улучшения
Улучшенное качество поиска
Встроенная база знаний была пере-embedded с использованием более мощной модели, что существенно улучшило релевантность ответов — в том числе при кросс-языковом поиске (например, когда вопрос задается на китайском языке по англоязычной документации). Существующие развертывания v1.3.x автоматически мигрируются во время обновления — см. Руководство по обновлению.
Гибридный ключевой и семантический поиск
Теперь ответы извлекаются с использованием комбинации семантического сходства и сопоставления по ключевым словам, после чего результаты объединяются в единый рейтинг. Это позволяет находить точные совпадения по ключевым словам, которые пропускает чисто семантический поиск, — такие как имена CRD, флаги команд и строки ошибок, — не теряя при этом возможности отвечать на вопросы на естественном языке.
Поиск на уровне документа
Теперь каждый документ индексируется не только по своим разделам, но и на уровне всего документа. Вопросы об общей теме документа теперь находят нужный документ даже тогда, когда формулировка пользователя не пересекается ни с одним конкретным абзацем.
Встроенный выбор пресета базы знаний
На странице установки теперь можно выбрать один из двух пресетов для встроенной базы знаний. Значение по умолчанию хорошо подходит для большинства запросов; более крупный пресет может давать немного лучший recall для вопросов, охватывающих длинные документы.
Обновление встроенной базы знаний во время апгрейда
При обновлении с v1.3.x до v1.4.x встроенная продуктовая база знаний заменяется новым дампом с GTE-embedded и автоматически мигрируются метаданные на уровне документов. Никаких ручных шагов по экспорту, импорту базы данных или перезапуску не требуется — см. Руководство по обновлению. Пользовательские и BYO базы знаний этим шагом не затрагиваются (см. разделы Breaking Changes и Known Limitations ниже).
Сжатие истории бесед
Длинные беседы автоматически суммируются, чтобы они помещались в окно контекста LLM без потери ранних сообщений. Это снижает стоимость токенов в длительных сессиях agent-mode и позволяет пользователям продолжать исследование в большом количестве сообщений без ухудшения качества.
Режим Agent Mode и загрузку инструментов MCP теперь можно настраивать независимо
Режим Agent Mode (многошаговое рассуждение) и загрузка инструментов ACP MCP теперь управляются раздельными переключателями установки. Вы можете включить Agent Mode без загрузки инструментов ACP MCP — например, когда LLM должен строить план только на основе встроенной базы знаний, — и снова включить инструменты, когда требуются операции с живым кластером.
Создание пользовательской базы знаний
Новое руководство помогает администраторам загружать внутренние Git-репозитории в базу знаний Hyperflux, чтобы Hyperflux мог отвечать на вопросы, основанные на внутренних runbooks, проектной документации и других внутренних источниках. См. Создание пользовательской базы знаний.
Улучшения
- Снижена стоимость токенов для ответов в agent-mode, когда инструменты возвращают большой объем вывода (например, логи или крупные определения ресурсов).
- Улучшена производительность хранилища для базы данных встроенной базы знаний.
Breaking Changes
- Пользовательские базы знаний, созданные в v1.3.x, необходимо перестроить перед обновлением. Новая модель embedding несовместима с предыдущей, поэтому существующие данные пользовательского корпуса не будут доступны до пересборки. См. руководство Создание пользовательской базы знаний для нового порядка действий.
Known Limitations
- Документы, загруженные через инструмент BYO Knowledge, сохраняются без изменений при обновлении до v1.4.0 — обновляется только встроенная продуктовая база знаний.
v1.3.1
Функции и улучшения
Инструмент BYO Knowledge
Инструмент BYO Knowledge позволяет организациям импортировать приватные знания и использовать их как выделенный, доступный для поиска источник знаний при ответах на вопросы. Это помогает командам формировать ответы на основе внутренних документов, операционных знаний и контекста, специфичного для организации.
Поддержка Multi-Cluster
Поддержка Multi-Cluster позволяет пользователям получать доступ к информации из нескольких кластеров по имени кластера, расширяя возможности question-answering за пределы границ одного кластера. Это упрощает запрос и сравнение ресурсов в разных кластерных средах.
Ограничения квот токенов
Ограничения квот токенов позволяют ограничивать частоту запросов и использование токенов на уровне пользователя. Это помогает администраторам контролировать затраты, управлять квотами и предотвращать чрезмерное потребление ресурсов модели.
История
Поддержка истории позволяет пользователям просматривать предыдущие беседы и результаты question-answering. Это упрощает отслеживание контекста, продолжение ранее начатых исследований и устранение проблем на основе прошлых взаимодействий.
Улучшения
- Оптимизированы процесс RAG (langchain) и reranking, что значительно повысило точность и релевантность ответов.
- Обновлен основной AI framework до LangChain 1.0 для совместимости с последними возможностями и оптимизациями.
- Добавлены регулярные prompts системной проверки, а также выполнена комплексная полировка кода и linting unit test.
- Разделены базы данных для системной базы знаний, пользовательской базы знаний и истории чатов, чтобы улучшить изоляцию данных и производительность.
- Переработана страница взаимодействия Smart Doc для более интуитивного и эффективного пользовательского опыта.
- Обновлен MCP server, добавлена поддержка OAuth authentication и настраиваемых записываемых конфигураций инструментов.
- Улучшена интеграция загрузки файлов для более плавного процесса ingestion знаний.
- Добавлена поддержка IDs в custom elements и устранены связанные проблемы с избыточностью данных.
- Реализован Redis-based rate limiter для повышения стабильности системы и управления API-трафиком.
Исправления ошибок
- Исправлена проблема, из-за которой загрузка модели могла завершаться сбоем, и улучшена настройка переменных окружения для embedding models.
- Устранены ошибки обработки данных, возникавшие при объединении и распаковке значений обновления.
- Исправлена ошибка, вызывавшая избыточные префиксы данных в custom elements.
- Устранены периодические сбои вызовов сервисов для повышения общей надежности системы.
v1.2.1
ПРИМЕЧАНИЕ: Agent mode — экспериментальная функция, используйте с осторожностью.
Исправления ошибок
- Исправлена проблема, из-за которой задание имени базы знаний могло не работать. Это исправление добавляет возможность задавать имя файла дампа базы данных во время установки и автоматически использовать указанный файл дампа базы данных для инициализации базы знаний.
- Исправлена проблема, из-за которой инструменты MCP могли создавать или удалять ресурсы K8s без подтверждения человека в режиме Agent mode.
- Исправлена проблема, при которой при запросе информации о свободном месте на диске с использованием Agent mode сервер мог зависать.
- Исправлена проблема, возникавшая при развертывании на ACP 4.2 или выше, когда не обрабатывались taints узлов по умолчанию.
- Исправлена ошибка развертывания:
kubeVersion: >=1.20.0 which is incompatible with Kubernetes v1.33.7-1. - Исправлена проблема, при которой API key для LLM service и rerank service отображался в открытом виде при развертывании.
Улучшения
- Улучшен prompt для корректной идентификации Hyperflux.
- Удалены неиспользуемые элементы конфигурации на странице установки.
v1.2.0
Функции и улучшения
- По умолчанию для ответов на вопросы пользователей используется RAG chain, что повышает точность ответов.
- Поддержан импорт дампа базы данных для инициализации базы знаний, что упрощает процесс настройки.
- Экспериментально: поддержано включение режима Agent mode для использования инструментов MCP и получения информации о кластере в реальном времени.
- Поддержано подключение к базе данных PGVector, развернутой вне установки Alauda Hyperflux.
- Поддержана модель Cohere Reranker для повышения релевантности ответов.
- Поддержана настройка параметров RAG chain, таких как total_search_k и т. д.
Известные проблемы
- При возникновении ошибок со стороны LLM формирование ответа может завершиться неудачей. При возврате к просмотру истории чата запрос будет снова отправлен в LLM, что приведет к дублированию бесед.