Google DeepMind анонсировала Genie 3 – свою новейшую модель мира, которая может использоваться для обучения универсальных ИИ-агентов. По словам разработчиков, эта технология представляет собой важный шаг на пути к созданию общего искусственного интеллекта (AGI), который будет сопоставим или превзойдет человеческий разум и сможет самостоятельно обучаться.
В отличие от предыдущей версии Genie 2, которая могла генерировать лишь 10-20 секунд контента, новая модель значительно нарастила производительность.
– Genie 3 – это первая интерактивная универсальная модель мира в реальном времени, – заявил директор по исследованиям DeepMind Шломи Фрухтер. – Модель способна генерировать как фотореалистичные, так и воображаемые миры по простому текстовому запросу.
Ключевые возможности:
- Создание интерактивных 3D-сред продолжительностью несколько минут;
- Разрешение 720p при 24 кадрах в секунду;
- Физическая согласованность симуляций благодаря способности модели «помнить» ранее сгенерированный контент;
- Возможность изменения созданного мира через текстовые команды.
Исследователи протестировали Genie 3 с ИИ-агентом SIMA, который успешно выполнял задачи в виртуальной складской среде, включая навигацию к различным объектам.
Однако модель пока имеет ограничения: поддержка лишь нескольких минут непрерывного взаимодействия, сложности с моделированием контактов между несколькими агентами и не всегда точная физика.
Несмотря на это, ИИ-модель открывает новые возможности для обучения ИИ-агентов самостоятельному планированию и исследованию мира – качествам, которые считаются ключевыми для достижения общего искусственного интеллекта.
Читайте по теме: DeepMind представила «золотую» ИИ-модель AlphaGeometry2.