Компания Stability AI представила раннюю предварительную версию флагманской генеративной ИИ-модели нового поколения Stable Diffusion 3.0, работающей по принципу «текст – изображение». Инструмент будет доступен в разных «комплектациях» – от 800 млн до 8 млрд параметров.
Согласно сообщению компании, новая модель Stable Diffusion 3.0 призвана обеспечить улучшенное качество изображений и более высокую производительность при генерации по многопредметным подсказкам. Она также обеспечит значительно лучшую типографику, чем предыдущие модели Stable Diffusion, что позволит более точно и последовательно прописывать текст в генерируемых изображениях.
Stable Diffusion 3.0 - это не просто новая версия модели, которую Stability AI уже выпустила, она фактически основана на новой архитектуре, – утверждают в компании.
Ранее в этом месяце компания выпустила предварительную версию Stable Cascade, которая использует архитектуру Würstchen для повышения производительности и точности. Stable Diffusion 3.0 использует другой подход, применяя трансформаторы диффузии.
Хотя Stable Diffusion 3.0 изначально демонстрируется как технология ИИ для преобразования текста в изображение, она станет основой для генерации 3D-объектов и видео.
– Мы создаем открытые модели, которые можно использовать где угодно и адаптировать под любые нужды. Это серия моделей разных размеров, которая ляжет в основу разработки визуальных моделей следующего поколения, включая видео, 3D и многое другое, – говорится в сообщении компании.