DeepMind научила ИИ создавать миры из текста

DeepMind научила ИИ создавать миры из текста

Британская компания Google DeepMind представила новую модель искусственного интеллекта под названием Genie 3, передает El.kz.

Это первый в своём роде универсальный симулятор, способный в режиме реального времени создавать интерактивные трёхмерные миры по простому текстовому запросу. Генерируемые сцены могут длиться несколько минут в разрешении 720p и с частотой 24 кадра в секунду, что значительно превосходит возможности предыдущей версии Genie 2.

Согласно разработчикам, модель не использует жёстко заданную физику, а сама обучается пониманию законов окружающего мира — как движутся объекты, падают и взаимодействуют между собой. Genie 3 также запоминает ранее созданные сцены, что обеспечивает физическую и визуальную последовательность симуляций.

Благодаря этому ИИ-агенты могут не просто реагировать на команды, а учиться, планировать и принимать решения на основе предыдущего опыта. В DeepMind считают, что такие модели важны для достижения уровня искусственного общего интеллекта (AGI).

Однако у Genie 3 есть ограничения: пока возможны лишь несколько минут взаимодействия, а также ограниченный набор действий для агентов. Несмотря на это, разработчики называют Genie 3 серьёзным шагом вперёд на пути к созданию интеллектуальных ИИ-агентов, способных осваивать новые стратегии, как это некогда сделал AlphaGo в игре против Ли Седоля.

Ранее мы рассказывали, что Nokia 3310 получила вторую жизнь с поддержкой 4G