Компания Google 17 апреля 2025 года анонсировала Gemini 2.5 Flash, новейшее пополнение в своем семействе передовых моделей искусственного интеллекта. Эта модель разработана для обеспечения высокой скорости и эффективности, но главной ее инновацией стала функция "Бюджет мышления" (Thinking Budget), предоставляющая разработчикам беспрецедентный контроль над использованием ресурсов моделью.
Gemini 2.5 Flash позиционируется как идеальное решение для задач, требующих быстрой реакции и обработки больших объемов запросов, таких как интеллектуальные чат-боты, системы рекомендаций в реальном времени и автоматизированный анализ данных. Модель сохраняет высокие показатели качества генерации, характерные для семейства Gemini, но оптимизирована для снижения задержек и стоимости операций.
Революционная функция "Бюджет мышления" позволяет разработчикам устанавливать лимиты на количество вычислительных операций или "внутренних шагов рассуждений", которые модель может использовать для генерации ответа. Это открывает возможности для тонкой настройки баланса между скоростью, стоимостью и глубиной анализа для каждого конкретного запроса или типа задач. Например, для простых запросов можно установить минимальный "бюджет", обеспечивая мгновенный ответ, в то время как для сложных аналитических задач бюджет можно увеличить для получения более развернутых и точных результатов. Google также намекнула на гибридную модель ценообразования, где стоимость может варьироваться в зависимости от установленного "бюджета мышления", предоставляя большую гибкость разработчикам.
По словам представителей Google, "Бюджет мышления" не просто ограничивает ресурсы, но и побуждает модель искать наиболее эффективные пути решения задачи в рамках заданных ограничений. Это может привести к разработке более "экономных" и целенаправленных алгоритмов рассуждения внутри самой модели.
Gemini 2.5 Flash будет доступна через API Google AI, а также интегрирована в платформу Vertex AI и Google AI Studio, предоставляя разработчикам полный набор инструментов для создания и масштабирования приложений на базе этой новой модели. Ожидается, что такая гибкость и контроль над ресурсами сделают Gemini 2.5 Flash популярным выбором для широкого круга разработчиков, стремящихся оптимизировать свои ИИ-решения.