Google anunció Gemini 2.5 Flash el 17 de abril de 2025, la última incorporación a su familia de modelos avanzados de inteligencia artificial. Este modelo está diseñado para alta velocidad y eficiencia, pero su principal innovación es la función "Presupuesto de Pensamiento" (Thinking Budget), que otorga a los desarrolladores un control sin precedentes sobre el uso de recursos del modelo.
Gemini 2.5 Flash se posiciona como una solución ideal para tareas que requieren respuestas rápidas y procesamiento de solicitudes de gran volumen, como chatbots inteligentes, sistemas de recomendación en tiempo real y análisis de datos automatizado. El modelo mantiene la alta calidad de generación característica de la familia Gemini pero está optimizado para reducir la latencia y los costos operativos.
La revolucionaria función "Presupuesto de Pensamiento" permite a los desarrolladores establecer límites en la cantidad de operaciones computacionales o "pasos de razonamiento interno" que el modelo puede usar para generar una respuesta. Esto abre posibilidades para ajustar con precisión el equilibrio entre velocidad, costo y profundidad de análisis para cada solicitud o tipo de tarea específicos. Por ejemplo, se puede establecer un "presupuesto" mínimo para consultas simples para garantizar una respuesta instantánea, mientras que para tareas analíticas complejas, el presupuesto se puede aumentar para obtener resultados más detallados y precisos. Google también insinuó un modelo de precios híbrido donde los costos podrían variar según el "presupuesto de pensamiento" establecido, brindando una mayor flexibilidad a los desarrolladores.
Según representantes de Google, el "Presupuesto de Pensamiento" no solo limita los recursos, sino que también alienta al modelo a encontrar las formas más eficientes de resolver una tarea dentro de las restricciones dadas. Esto podría llevar al desarrollo de algoritmos de razonamiento más "económicos" y enfocados dentro del propio modelo.
Gemini 2.5 Flash estará disponible a través de la API de Google AI e integrado en la plataforma Vertex AI y Google AI Studio, proporcionando a los desarrolladores un conjunto completo de herramientas para crear y escalar aplicaciones basadas en este nuevo modelo. Se espera que tal flexibilidad y control de recursos hagan de Gemini 2.5 Flash una opción popular para una amplia gama de desarrolladores que buscan optimizar sus soluciones de IA.