• Русский
  • Примечания к выпуску

    v1.4.0

    Функции и улучшения

    Улучшенное качество поиска

    Встроенная база знаний была пере-embedded с использованием более мощной модели, что существенно улучшило релевантность ответов — в том числе при кросс-языковом поиске (например, когда вопрос задается на китайском языке по англоязычной документации). Существующие развертывания v1.3.x автоматически мигрируются во время обновления — см. Руководство по обновлению.

    Гибридный ключевой и семантический поиск

    Теперь ответы извлекаются с использованием комбинации семантического сходства и сопоставления по ключевым словам, после чего результаты объединяются в единый рейтинг. Это позволяет находить точные совпадения по ключевым словам, которые пропускает чисто семантический поиск, — такие как имена CRD, флаги команд и строки ошибок, — не теряя при этом возможности отвечать на вопросы на естественном языке.

    Поиск на уровне документа

    Теперь каждый документ индексируется не только по своим разделам, но и на уровне всего документа. Вопросы об общей теме документа теперь находят нужный документ даже тогда, когда формулировка пользователя не пересекается ни с одним конкретным абзацем.

    Встроенный выбор пресета базы знаний

    На странице установки теперь можно выбрать один из двух пресетов для встроенной базы знаний. Значение по умолчанию хорошо подходит для большинства запросов; более крупный пресет может давать немного лучший recall для вопросов, охватывающих длинные документы.

    Обновление встроенной базы знаний во время апгрейда

    При обновлении с v1.3.x до v1.4.x встроенная продуктовая база знаний заменяется новым дампом с GTE-embedded и автоматически мигрируются метаданные на уровне документов. Никаких ручных шагов по экспорту, импорту базы данных или перезапуску не требуется — см. Руководство по обновлению. Пользовательские и BYO базы знаний этим шагом не затрагиваются (см. разделы Breaking Changes и Known Limitations ниже).

    Сжатие истории бесед

    Длинные беседы автоматически суммируются, чтобы они помещались в окно контекста LLM без потери ранних сообщений. Это снижает стоимость токенов в длительных сессиях agent-mode и позволяет пользователям продолжать исследование в большом количестве сообщений без ухудшения качества.

    Режим Agent Mode и загрузку инструментов MCP теперь можно настраивать независимо

    Режим Agent Mode (многошаговое рассуждение) и загрузка инструментов ACP MCP теперь управляются раздельными переключателями установки. Вы можете включить Agent Mode без загрузки инструментов ACP MCP — например, когда LLM должен строить план только на основе встроенной базы знаний, — и снова включить инструменты, когда требуются операции с живым кластером.

    Создание пользовательской базы знаний

    Новое руководство помогает администраторам загружать внутренние Git-репозитории в базу знаний Hyperflux, чтобы Hyperflux мог отвечать на вопросы, основанные на внутренних runbooks, проектной документации и других внутренних источниках. См. Создание пользовательской базы знаний.

    Улучшения

    • Снижена стоимость токенов для ответов в agent-mode, когда инструменты возвращают большой объем вывода (например, логи или крупные определения ресурсов).
    • Улучшена производительность хранилища для базы данных встроенной базы знаний.

    Breaking Changes

    • Пользовательские базы знаний, созданные в v1.3.x, необходимо перестроить перед обновлением. Новая модель embedding несовместима с предыдущей, поэтому существующие данные пользовательского корпуса не будут доступны до пересборки. См. руководство Создание пользовательской базы знаний для нового порядка действий.

    Known Limitations

    • Документы, загруженные через инструмент BYO Knowledge, сохраняются без изменений при обновлении до v1.4.0 — обновляется только встроенная продуктовая база знаний.

    v1.3.1

    Функции и улучшения

    Инструмент BYO Knowledge

    Инструмент BYO Knowledge позволяет организациям импортировать приватные знания и использовать их как выделенный, доступный для поиска источник знаний при ответах на вопросы. Это помогает командам формировать ответы на основе внутренних документов, операционных знаний и контекста, специфичного для организации.

    Поддержка Multi-Cluster

    Поддержка Multi-Cluster позволяет пользователям получать доступ к информации из нескольких кластеров по имени кластера, расширяя возможности question-answering за пределы границ одного кластера. Это упрощает запрос и сравнение ресурсов в разных кластерных средах.

    Ограничения квот токенов

    Ограничения квот токенов позволяют ограничивать частоту запросов и использование токенов на уровне пользователя. Это помогает администраторам контролировать затраты, управлять квотами и предотвращать чрезмерное потребление ресурсов модели.

    История

    Поддержка истории позволяет пользователям просматривать предыдущие беседы и результаты question-answering. Это упрощает отслеживание контекста, продолжение ранее начатых исследований и устранение проблем на основе прошлых взаимодействий.

    Улучшения

    • Оптимизированы процесс RAG (langchain) и reranking, что значительно повысило точность и релевантность ответов.
    • Обновлен основной AI framework до LangChain 1.0 для совместимости с последними возможностями и оптимизациями.
    • Добавлены регулярные prompts системной проверки, а также выполнена комплексная полировка кода и linting unit test.
    • Разделены базы данных для системной базы знаний, пользовательской базы знаний и истории чатов, чтобы улучшить изоляцию данных и производительность.
    • Переработана страница взаимодействия Smart Doc для более интуитивного и эффективного пользовательского опыта.
    • Обновлен MCP server, добавлена поддержка OAuth authentication и настраиваемых записываемых конфигураций инструментов.
    • Улучшена интеграция загрузки файлов для более плавного процесса ingestion знаний.
    • Добавлена поддержка IDs в custom elements и устранены связанные проблемы с избыточностью данных.
    • Реализован Redis-based rate limiter для повышения стабильности системы и управления API-трафиком.

    Исправления ошибок

    • Исправлена проблема, из-за которой загрузка модели могла завершаться сбоем, и улучшена настройка переменных окружения для embedding models.
    • Устранены ошибки обработки данных, возникавшие при объединении и распаковке значений обновления.
    • Исправлена ошибка, вызывавшая избыточные префиксы данных в custom elements.
    • Устранены периодические сбои вызовов сервисов для повышения общей надежности системы.

    v1.2.1

    ПРИМЕЧАНИЕ: Agent mode — экспериментальная функция, используйте с осторожностью.

    Исправления ошибок

    • Исправлена проблема, из-за которой задание имени базы знаний могло не работать. Это исправление добавляет возможность задавать имя файла дампа базы данных во время установки и автоматически использовать указанный файл дампа базы данных для инициализации базы знаний.
    • Исправлена проблема, из-за которой инструменты MCP могли создавать или удалять ресурсы K8s без подтверждения человека в режиме Agent mode.
    • Исправлена проблема, при которой при запросе информации о свободном месте на диске с использованием Agent mode сервер мог зависать.
    • Исправлена проблема, возникавшая при развертывании на ACP 4.2 или выше, когда не обрабатывались taints узлов по умолчанию.
    • Исправлена ошибка развертывания: kubeVersion: >=1.20.0 which is incompatible with Kubernetes v1.33.7-1.
    • Исправлена проблема, при которой API key для LLM service и rerank service отображался в открытом виде при развертывании.

    Улучшения

    • Улучшен prompt для корректной идентификации Hyperflux.
    • Удалены неиспользуемые элементы конфигурации на странице установки.

    v1.2.0

    Функции и улучшения

    • По умолчанию для ответов на вопросы пользователей используется RAG chain, что повышает точность ответов.
    • Поддержан импорт дампа базы данных для инициализации базы знаний, что упрощает процесс настройки.
    • Экспериментально: поддержано включение режима Agent mode для использования инструментов MCP и получения информации о кластере в реальном времени.
    • Поддержано подключение к базе данных PGVector, развернутой вне установки Alauda Hyperflux.
    • Поддержана модель Cohere Reranker для повышения релевантности ответов.
    • Поддержана настройка параметров RAG chain, таких как total_search_k и т. д.

    Известные проблемы

    • При возникновении ошибок со стороны LLM формирование ответа может завершиться неудачей. При возврате к просмотру истории чата запрос будет снова отправлен в LLM, что приведет к дублированию бесед.