• нейросети
  • статьи
  • 20 часов

Что такое модели мира в ИИ: как работает Project Genie и зачем нужен AGI

Что такое моделирование мира, как работает Genie 3, а также почему это направление важно для будущего ИИ – в материале.

0

Летом 2025 года Google DeepMind представила так называемую «модель мира» для обучения универсальных ИИ-агентов. По словам разработчиков, Genie 3 стала важным шагом на пути к созданию искусственного общего интеллекта (AGI) – систем, которые могут вести себя почти как человек.

По словами Шломи Фрухтера, директора по исследованиям DeepMind, Genie 3 называют первой универсальной моделью мира, которая работает в реальном времени. В отличие от предыдущих версий, она не привязана к одной среде. Поэтому умеет создавать как очень реалистичные, так и полностью вымышленные пространства.

Источник: Сравнение моделей / deepmind.google
Источник: Сравнение моделей / deepmind.google

По сути, за счет модели пользователи могут взаимодействовать с симуляциями, которые очень близки к реальному миру. А ИИ, в свою очередь, – обучать сложные системы, вроде роботов или беспилотного транспорта.

В январе 2026 года компания открыла ограниченный доступ к Project Genie для подписчиков Google AI Ultra в США (18+). Теперь пользователи могут сами создавать, изучать, изменять интерактивные миры.

Что такое моделирование мира, как работает Genie 3, а также почему это направление важно для будущего ИИ – в материале.

Зачем нужны модели мира в ИИ

Современный ИИ в основном учится на текстах, картинках или видео. Но чтобы двигаться дальше, ему нужен практический опыт взаимодействия с миром. Именно для этого создают модели мира.

Суть в том, чтобы научить искусственный интеллект понимать окружающую среду, а после предсказывать, что произойдет. Примерно так же, как это делают люди или животные.

Для обучения используют цифровые тренажеры. Например, как виртуальные автосимуляторы для обучения вождению или Microsoft Flight Simulator для пилотов.

Такие модели учитывают физику, время, причинно-следственные связи. Благодаря им ИИ может не просто реагировать на данные, а планировать действия, предугадывать последствия, адаптироваться к изменениям.

Этот подход уже начинает применяться на практике. А именно, в разработке роботов, беспилотных автомобилей, автономных систем. Многие эксперты считают, что модели мира станут важным фундаментом для создания искусственного общего интеллекта (AGI).

Генеральный директор Nvidia Дженсен Хуанг отмечал, что такие модели помогут раскрыть потенциал физического ИИ. То есть систем, которые будут управлять роботами в реальном мире.

Сегодня основной интерес индустрии сосредоточен на чат-ботах, а также генерации контента, но именно модели мира постепенно становятся одним из самых перспективных направлений. Они в частности полезны там, где обычный ИИ пока слаб: в пространственном мышлении, планировании, понимании физического мира.

Один из таких как раз – модель Genie 3 от Google DeepMind. Она умеет создавать фотореалистичные виртуальные пространства по текстовому описанию, а еще позволяет ИИ тренироваться внутри них.

Project Genie: как работает модель мира от Google

Project Genie – это экспериментальное веб-приложение от Google DeepMind. Оно позволяет пользователям взаимодействовать с моделями мира и тестировать их возможности в живых, интерактивных средах.

Доступ к проекту открыли 29 января 2026 года для подписчиков Google AI Ultra в США. Позже географию планируют расширить.

Отметим, что Genie 3 создает виртуальные миры постепенно. Каждый новый кусок сцены строится на основе того, что уже сгенерировано раньше. Благодаря этому система может предсказывать, как дальше будет развиваться окружение.

Чтобы все работало в реальном времени, модель постоянно проводит расчеты. Она заново обрабатывает сцену несколько раз в секунду, при этом присутствует согласованность с тем, что было раньше. Ее память может охватывать до минуты предыдущих кадров.

Физика в этих мирах не прописана вручную. Модель сама учится законам реального мира на огромном количестве данных. Поэтому объекты в Genie 3 двигаются и взаимодействуют довольно естественно. Не требуется даже включение программистов, которые отдельно бы задавали гравитацию или правила столкновений.

Пока Project Genie – исследовательский прототип. В основе него лежат три функции:

  • Создание мира. Пользователь описывает мир текстом или загружает изображение. Можно задать персонажа, окружение и способ передвижения. Например, ходить пешком, летать или ездить.
  • Исследование мира. После создания можно свободно перемещаться внутри мира. Система в реальном времени достраивает окружение в зависимости от действий человека. Также можно менять положение камеры.
  • Изменение мира. Можно редактировать уже созданные сцены: добавлять новые элементы или менять структуру мира на ходу.

Поскольку Genie 3 ещё находится на ранней стадии, у приложения есть ограничения:

  • Миры не всегда точно следуют законам физики, а также исходному описанию;
  • Иногда бывают задержки в управлении;
  • Длина одной сессии ограничена примерно 60 секундами;
  • Некоторые заявленные функции, включая динамические события, пока не работают.

Google запустила Project Genie, чтобы лучше понять, как люди взаимодействуют с такими моделями.

Как модели мира приближают AGI

Google DeepMind уже больше десяти лет работает над моделированием разных сред, включая обучение ИИ сложным стратегиям, а также симуляции для роботов.

Genie 3, грубо говоря, продолжает эту работу. На демонстрациях для журналистов показали, как она создает сцены катания на лыжах, работы на складе. По качеству картинки она близка к Veo 3. Но главное отличие в том, что улучшенная версия может работать долгое время.

По данным DeepMind, их модель окружающего мира генерирует сцены практически мгновенно на основе текстовых запросов. При этом созданную среду можно оперативно изменять: достаточно добавить новый запрос, чтобы, к примеру, в уже смоделированной локации появились другие элементы.

Например, реалистичная симуляция склада помогает роботу потренироваться в безопасной цифровой среде, прежде чем выйти в реальный мир.

Источник: Записи взаимодействий в реальном времени с устройством Genie 3 / deepmind.google
Источник: Записи взаимодействий в реальном времени с устройством Genie 3 / deepmind.google

Почему в модели мира сейчас инвестируют

Интерес к этому направлению быстро растет и среди инвесторов. Например, европейский стартап AMI Labs, который работает над своей версией модели мира, уже привлек более $1 млрд.

Известный ученый Яна Лекун тоже обратил внимание на новый тип систем. В подкасте он открыто выразил сомнение в том, что масштабирование LLM сработает в лучшую для общественности сторону, по сравнению с теми же моделями мира.

Сам он сейчас сосредоточился на своем новом проекте, компании Advanced Machine Intelligence (AMI). Стартап занимается изучением моделей поведения человека, а также планирует развивать технологии с открытым исходным кодом.Такие модели учатся на реальных данных и способны создавать интерактивные трехмерные среды.

Специалисты считают, что главная ценность моделей мира заключается в возможности искусственного интеллекта взаимодействовать с реальной средой. Грубо говоря, виртуальные среды безопасно, а еще относительно дешево обучают ИИ.

Сооснователь Runway Анастасис Германидис отмечает, что обучение в симуляции проходит быстрее и дешевле, чем работа с реальными объектами. Его компания представила свою модель мира GWM-1 в декабре 2025 года.

Джефф Клун, который участвовал в разработке Genie, добавляет, что модели мира особенно эффективны для обучения роботов и беспилотного транспорта.

Заключение

В компании ожидают, что технологии моделирования мира будут играть более значимую роль, когда ИИ-агенты начнут активно взаимодействовать с реальным физическим миром. Хотя AGI часто ассоциируют с заменой офисных работников, в Google делают акцент на практическом применении. А именно, обучении роботов с автономными системами.

По словам DeepMind, Genie 3 – серьезный прогресс. Модель позволяет ИИ-агентам изучать окружение, взаимодействовать с ним, учиться внутри подробных симуляций.

0

Комментарии

0