Новая ИИ-модель Whisk от Google генерирует изображения, принимая картинки и фотографии в качестве подсказок. По словам разработчиков, нейросеть создана для тех, кому надоело писать подробные промпты.
С помощью Whisk пользователи могут создавать изображения AI, просто перетаскивая картинки в инструмент. Дальше генератор сделает все остальное.
С помощью Whisk пользователи могут предоставлять готовые картинки или фотографии, чтобы определить тему, сцену и стиль генерируемого искусственным интеллектом изображения. Они также могут предложить Whisk несколько картинок для каждого из этих элементов. Кроме того, при желании пользователи могут заполнить текстовые подсказки.
Для тех, у кого нет под рукой изображений, ИИ-модель предоставит сгенерированные картинки в качестве подсказок. В конце процесса пользователь может добавить текстовые подробности о желаемом изображении, хотя этот шаг необязателен.
Whisk работает на базе ИИ-моделей Gemini и Imagen. По словам представителей компании, Gemini работает в фоновом режиме, преобразуя загружаемые пользователями изображения в подробные текстовые подсказки для модели искусственного интеллекта.
В своем блоге Google подчеркивает, что Whisk предназначен для «быстрого визуального исследования, а не для попиксельного редактирования». Компания также признает, что иногда Whisk может «промахнуться», поэтому в нем предусмотрена возможность редактирования базовых подсказок.