OpenAI решила сосредоточить свое внимание на создании видеороликов при помощи искусственного интеллекта. Компания представила генеративную ИИ-модель Sora, которая создает видео по текстовым подсказкам.
По заявлению OpenAI, получив описание или неподвижное изображение, Sora может сгенерировать ролик с несколькими персонажами, различными типами движения и деталями фона. Sora также может расширить существующие видеоклипы – заполнив недостающие детали.
– Sora обладает глубоким пониманием языка, что позволяет ей точно интерпретировать подсказки и генерировать убедительных персонажей, выражающих яркие эмоции. Модель понимает, о чем пользователь попросил в подсказке, а также, как эти вещи существуют в физическом мире, – говорится в сообщении OpenAI.
Sora способна генерировать видеоролики в различных стилях (например, фотореалистичные, анимированные, черно-белые) длиной до минуты – гораздо более продолжительные, чем большинство моделей преобразования текста в видео.
OpenAI позиционирует Sora как предварительное исследование, не раскрывая подробную информацию о том, какие данные использовались для обучения модели и воздерживаясь от предоставления Sora в общий доступ.
OpenAI заявляет, что работает с экспертами над проверкой модели на наличие уязвимостей и создает инструменты для определения происхождения видео. Компания также заявляет, что если она решит превратить модель в общедоступный продукт, то обеспечит включение метаданных о происхождении в генерируемые результаты.
– Мы будем взаимодействовать с политиками, преподавателями и художниками по всему миру, чтобы определить положительные примеры использования этой новой технологии. Несмотря на обширные исследования и испытания, мы не можем предсказать все полезные способы использования нашей технологии, равно как и все способы злоупотребления ею. Именно поэтому мы считаем, что изучение опыта реального использования – важнейший компонент создания и выпуска со временем все более безопасных систем ИИ, – пишут представители OpenAI.