Компания Google запустила нейросеть Imagen, которая создает изображения по текстовому описанию. Алгоритмы способны «рисовать» в различных стилях – от масляных картин до компьютерного рендеринга и даже фотографий.
На сегодняшний день лидером в этой области является DALLE – программа, созданная коммерческой лабораторией OpenAI.
Впрочем, Imagen от Google превосходит конкурента по многим параметрам, таким так точность и соответствие описанию.
Так, например, при запросе «Панда делает латте-арт» Imagen подошел к вопросу более точно и творчески, показав различные вариации. А вот программа DALL-E 2 фантазию не включила – показала просто латте-арты с пандами.
Нейросеть распознает запросы благодаря созданным языковым моделям. Как только Imagen «понимает» смысл задания он формирует небольшую картинку размером 64 х 64 пикселя. Затем алгоритм улучшает и дорабатывает изображение. На выходе получается картинка размером 1024 х 1024 пикселя.
Пока Imagen имеет статус экспериментального продукта. Обычные пользователи пока не могут получить к нему доступ.
Компания не объявляла, когда сервис станет доступным для массового использования.