Параметры модели

Beta feature. Learn more.

Параметры модели задают, какую модель использует агент и как она генерирует ответы. Настройте их в панели параметры модели в Agent Builder.

Провайдер и модель

Провайдер — внешний провайдер LLM.
Модель — конкретная модель этого провайдера. У разных моделей разные сильные стороны: крупные модели для рассуждений подходят для задач, требующих сложного планирования, а более быстрые компактные модели — для рутинных запросов.

Провайдер и модель обязательны. Остальная часть панели подстраивается под возможности выбранной модели.

Ограничения контекста и вывода

Максимум токенов контекста — ограничивает общий объём контекста, который агент отправляет модели. Оставьте System, чтобы использовать значение модели по умолчанию. Уменьшите это значение, чтобы снизить затраты; увеличьте его для агентов, которым нужно анализировать большие объёмы входных данных.
Максимум токенов вывода — ограничивает размер ответа агента. System использует значение модели по умолчанию. Установите меньшее значение, если ответы получаются слишком длинными, и большее — если они обрезаются.
Лимит токенов файла — ограничивает, сколько токенов из одного загруженного файла попадает в контекст. Это полезно, когда пользователи прикрепляют большие файлы и вы не хотите, чтобы они вытесняли остальную часть диалога.

Сэмплинг

Temperature — степень случайности. Более высокие значения (0.7–1.0) = больше случайности, а более низкие (0.0–0.3) = более сфокусированный и предсказуемый результат. Рекомендуем изменять либо этот параметр, либо Top P, но не оба сразу.
Top P — сэмплинг по ядру распределения. Меняет то, как модель выбирает токены для вывода.
Top K — ограничивает сэмплинг K наиболее вероятными токенами на каждом шаге. Поддерживается некоторыми провайдерами; управляет предсказуемостью по другой оси, чем Temperature.

Если вы не настраиваете модель под конкретное поведение, оставьте ползунки близкими к значениям по умолчанию — небольшие изменения здесь редко дают заметный эффект, а большие могут ухудшить качество вывода.

Параметры рассуждения

Доступно для моделей с поддержкой расширенного рассуждения. Точный набор зависит от провайдера.

Thinking — включает или отключает режим расширенного рассуждения модели. Когда он включен, модель перед окончательным ответом генерирует внутренние токены рассуждения; обычно это повышает точность на сложных задачах, но увеличивает задержку и расход токенов.
Thinking Budget — бюджет токенов для этапа рассуждения. Модель прекращает рассуждение и дает ответ, как только израсходует это количество токенов.
Effort — общий уровень интенсивности рассуждения (Auto, low, medium, high). Используется моделями рассуждения, которые не предоставляют бюджет токенов для Thinking напрямую.
Thought Visibility — определяет, будет ли ход рассуждения модели показан пользователю прямо в тексте, скрыт в свернутом виде или полностью опущен.

Поведение беседы

Повторно отправлять файлы — если включено, файлы, прикреплённые в предыдущих сообщениях, будут повторно отправляться с каждым следующим сообщением, чтобы модель не теряла контекст. Отключите этот параметр, чтобы сэкономить токены, если беседа короткая или модель по ходу работы сама суммирует содержимое файлов.
Использовать кэширование промптов — если провайдер поддерживает эту функцию, кэширует повторно используемые части промпта, чтобы снизить стоимость и задержку в беседах, где инструкции и описания инструментов повторяются от сообщения к сообщению.
Веб-поиск — включает встроенный у провайдера веб-поиск на поддерживаемых моделях. Это отличается от инструмента веб-поиска, который работает как один из инструментов агента, а не как возможность провайдера.

Сброс

Сброс параметров модели в нижней части панели возвращает все поля к системным значениям по умолчанию. Используйте эту функцию, если вы уже достаточно поэкспериментировали и хотите начать с чистого листа.

Провайдер и модель​

Ограничения контекста и вывода​

Сэмплинг​

Параметры рассуждения​

Поведение беседы​

Сброс​