Google запускает Gemini 2.5 Computer Use для управления браузером с помощью ИИ

Google запускает Gemini 2.5 Computer Use для управления браузером с помощью ИИ

Компания Google 7 октября 2025 года представила Gemini 2.5 Computer Use — новую специализированную модель, которая наделяет ИИ способностью напрямую управлять веб-браузером. Технология работает в цикле: модель "видит" скриншот экрана, анализирует задачу пользователя и генерирует действие (клик, ввод текста, скроллинг). После выполнения действия делается новый скриншот, и цикл повторяется до завершения задачи. Это позволяет Gemini выполнять сложные многоэтапные задания по одной команде, например, найти информацию о рейсах на одном сайте, забронировать отель на другом и собрать все данные в таблицу. Как отмечает The Verge, эта возможность превращает ИИ из информационного помощника в полноценного "агента-исполнителя". В отличие от некоторых конкурентов, текущая версия ограничена только управлением браузером, а не всей операционной системой. Технология уже доступна разработчикам в превью-режиме через Google AI Studio и Vertex AI.

« Назад к списку новостей