Главная страница / Читать / Новости / ИИ-модель Whisk принимает картинки в качестве подсказок

ИИ-модель Whisk принимает картинки в качестве подсказок

Дата публикации: Дек 20, 2024

Новая ИИ-модель Whisk от Google генерирует изображения, принимая картинки и фотографии в качестве подсказок. По словам разработчиков, нейросеть создана для тех, кому надоело писать подробные промпты.

С помощью Whisk пользователи могут создавать изображения AI, просто перетаскивая картинки в инструмент. Дальше генератор сделает все остальное.

С помощью Whisk пользователи могут предоставлять готовые картинки или фотографии, чтобы определить тему, сцену и стиль генерируемого искусственным интеллектом изображения. Они также могут предложить Whisk несколько картинок для каждого из этих элементов. Кроме того, при желании пользователи могут заполнить текстовые подсказки.

Для тех, у кого нет под рукой изображений, ИИ-модель предоставит сгенерированные картинки в качестве подсказок. В конце процесса пользователь может добавить текстовые подробности о желаемом изображении, хотя этот шаг необязателен.

Whisk работает на базе ИИ-моделей Gemini и Imagen. По словам представителей компании, Gemini работает в фоновом режиме, преобразуя загружаемые пользователями изображения в подробные текстовые подсказки для модели искусственного интеллекта.

В своем блоге Google подчеркивает, что Whisk предназначен для «быстрого визуального исследования, а не для попиксельного редактирования». Компания также признает, что иногда Whisk может «промахнуться», поэтому в нем предусмотрена возможность редактирования базовых подсказок.

Поделиться статьей в соц. сетях

Автор

Виктор Сапожников

Теги статьи

google, искусственный интеллект

Оставайтесь на связи с ER10 Media! Вы можете найти нас в:

Интернет-издание о бизнесе, стартапах и IT-технологиях

ИИ-модель Whisk принимает картинки в качестве подсказок

Добавить комментарий Отменить ответ