Перейти к основному содержимому
Перейти к основному содержимому

Генерация изображений

Beta feature. Learn more.

Генерация изображений позволяет агенту создавать новые изображения на основе текстового промпта или редактировать изображения, загруженные пользователем. Агент выбирает между генерацией и редактированием в зависимости от запроса и доступного контекста.

Включите её

Включите инструмент генерации изображений в разделе возможностей Agent Builder. Некоторые агенты имеют доступ к нескольким провайдерам изображений (например, DALL-E и Flux); агент сам выбирает подходящий, либо вы можете ограничить выбор в инструкциях.

Генерация

Когда пользователь запрашивает изображение, агент вызывает инструмент генерации с промптом и возвращает полученное изображение непосредственно в ответе. Агент сохраняет ссылку на изображение в своём контексте, чтобы затем описать его или повторно использовать в рамках того же диалога.

Редактирование

Если пользователь загружает изображение и просит внести изменения — изменить цвет, добавить объект или расширить композицию, — агент использует вариант инструмента для редактирования. Результат заменяет соответствующую область или расширяет исходное изображение в соответствии с запросом.

Примечания

  • Сгенерированные изображения не отправляются автоматически в отдельную систему анализа изображений. Если вам нужно, чтобы агент интерпретировал изображение, используйте vision с изображением, загруженным пользователем.
  • Действуют политики провайдера в отношении контента. Промпты, нарушающие политику провайдера, приводят к ошибке, а не к созданию изображения.