blog.google

Gemini 3 от Google: что умеет, как работать и чем отличается от предыдущих версий

Gemini 3 - новая мультимодальная нейросеть от Google, представлена 18 ноября 2025 года. Это одна из самых «умных» моделей Google: она сочетает мощное рассуждение, глубокое понимание разных типов данных (текст, изображения, видео, аудио и код), а также агентные и программируемые способности, сообщает интернет-портал El.kz.

Модель доступна в ряде продуктов Google: в приложении Gemini, через API в Google AI Studio, на платформе Vertex AI, а также в корпоративной версии Gemini Enterprise. Кроме основной версии, есть Deep Think - режим с усиленным рассуждением, предназначенный для особенно сложных задач.

Возможности Gemini 3

Углублённое рассуждение

Gemini 3 Pro значительно улучшил мыслительные способности: модель показывает высокий уровень на сложных тестах. По данным Google, она «понимает глубину и нюанс», что позволяет ей давать более вдумчивые ответы.

Режим Deep Think выдаёт ещё более продвинутые результаты на сложных задачах - по тестам Gemini 3 Deep Think опережает Pro‑версию.

Мультимодальность

Gemini 3 может обрабатывать разные типы данных: текст, изображения, видео, аудио и код.

Она отлично работает не только с текстом, но и с визуальными или пространственными задачами: распознаёт сложные документы, предсказывает траектории (например, для роботов), а также понимает действия на экране устройств.

Видео‑анализ тоже подкреплён: модель может «понимать» динамику сцены, обрабатывать длинные видеозаписи и вычленять важные моменты.

Кодинг и агентные функции

Gemini 3 - одна из самых продвинутых моделей Google для кодирования, особенно в стиле «vibe coding», когда ИИ старается «почувствовать» задачу и написать код, соответствующий задумке пользователя.

Её агентные способности позволяют выполнять многоэтапные сценарии: например, организовать ваш почтовый ящик, забронировать поездку, взаимодействовать с Google Calendar и Gmail. В приложении Gemini появился экспериментальный агент (Gemini Agent), использующий эти способности.

Для разработчиков Google представил новую платформу - Google Antigravity, где Gemini 3 может самостоятельно планировать, кодифицировать и проверять задачи.

Умные интерфейсы

Gemini 3 умеет формировать ответы не просто текстом - она может сама генерировать визуальные лэйауты, таблицы, симуляции или встраивать интерактивные инструменты прямо в ответ.

Такой интерфейс делает ответы более наглядными и удобными - например, при планировании путешествия Gemini создаёт визуализированный маршрут, а при объяснении сложной темы - динамическую структуру с изображениями и интерактивом.

Безопасность и контроль

Google подчёркивает, что Gemini 3 - одна из самых безопасных моделей: провело «самую полную проверку из всех моделей Google». Уменьшено «подлизывание» (sycophancy), улучшена устойчивость к вредоносным запросам и повышена защита от эксплуатации.

Как пользоваться Gemini 3

Через приложение Gemini: Обновлённое приложение получило новый дизайн, папку «My Stuff» для сохранённого контента и интерфейсы с визуальными лэйаутами или «динамическим видом».

Через Google Search: В режиме «AI Mode» теперь используется Gemini 3 - он формирует ответы с визуальными и интерактивными элементами.

Для разработчиков: Доступ через Gemini API в Google AI Studio, а также в Vertex AI.

Для агентной разработки: Используйте платформу Google Antigravity, чтобы создавать задачи, которые Gemini 3 будет выполнять автономно.

Примеры использования Gemini 3

Обучение и учебные материалы

Вы можете загрузить длинные тексты, лекции или видео, а Gemini 3 обработает их и создаст визуализации, флеш-карточки или конспекты.

Кодирование

Модель способна генерировать код, например визуализировать физическую систему - физический поток плазмы или 3D‑объекты.

Планирование задач и жизни

Через Gemini Agent можно делегировать задачу ИИ: по заданию спланировать поездку, составить расписание и даже вести переписку с учётом ваших данных в Gmail и Календаре.

Анализ видео

При загрузке видео Gemini может разобрать действия, выделить ключевые моменты и предложить анализ - полезно для спортивного тренинга, обучения или подготовки докладов.

Чем Gemini 3 отличается от предыдущих версий

Глубина рассуждений: Gemini 3 Pro и особенно Deep Think показывают более высокий интеллект и способность решать сложные задачи, чем Gemini 2.x моделей.

Контекст: Модель поддерживает очень большой контекст (до миллиона токенов), что позволяет работать с объёмными документами, видео или кодом.

Мультимодальность: Улучшено понимание и обработка изображений, видео и аудио - модель стала ещё более гибкой в работе с разными форматами.

Интерактивные интерфейсы: Появились генеративные интерфейсы - Gemini сама «решает», как лучше представить информацию визуально и интерактивно.

Кодирование и агенты: Введены агенты (Gemini Agent), а также платформа Antigravity для кода и автоматических действий - раньше такого уровня автономии у Gemini не было.

Безопасность: Модель имеет усиленные меры безопасности, более строгий контроль «мыслей» и лучшую устойчивость к вредоносным запросам.

В релизе нейросети генеральный директор Google и Alphabet Сундар Пичаи назвал Gemini 3 «самой интеллектуальной моделью», которая объединяет все возможности Gemini, позволяющей воплотить любую идею в жизнь.

«Он обладает передовыми технологиями логического мышления, способными улавливать глубину и нюансы — будь то восприятие тонких намёков в творческой идее или анализ накладывающихся друг на друга слоёв сложной проблемы. Gemini 3 также гораздо лучше понимает контекст и намерения вашего запроса, поэтому вы получаете то, что вам нужно, с меньшим количеством подсказок. Удивительно, что всего за два года ИИ прошёл путь от простого чтения текста и изображений до анализа помещения», - отметил Сундар Пичаи.

По его словам, как и предыдущие поколения, Gemini 3 вновь продвигает передовые технологии.

«В этой новой главе мы продолжим расширять границы интеллекта, агентов и персонализации, чтобы сделать ИИ по-настоящему полезным для каждого», - заключил он.

Gemini 3 - это значительный шаг вперёд в развитии AI-моделей Google. Она сочетает в себе мощное логическое мышление, глубокую работу с визуальной информацией, способность программировать и выполнять задачи автономно. Это делает её не просто «умным чат‑ботом», а настоящим партнёром для обучения, работы и творчества.

Ранее DeepMind показал прототип SIMA-2 – нового агента на базе Gemini, способного самостоятельно исследовать виртуальные миры и ставить себе задачи.