Fujitsu Presenta una Tecnología de Reconstrucción de IA que Permite Ejecutar LLMs en una Sola GPU

Fujitsu Presenta una Tecnología de Reconstrucción de IA que Permite Ejecutar LLMs en una Sola GPU

Fujitsu anunció una tecnología revolucionaria el 8 de septiembre de 2025 que "aligera" significativamente los grandes modelos de lenguaje (LLM) sin una pérdida sustancial de precisión. La tecnología, basada en el Takane LLM propiedad de la compañía, combina dos métodos clave: cuantificación de 1 bit y "destilación" de IA especializada. Esto ha resultado en una reducción del 94% en el consumo de memoria y un aumento de 3 veces en la velocidad de inferencia, al tiempo que se retiene el 89% de la precisión del modelo original. En la práctica, esto significa que un LLM que antes requería un clúster de cuatro GPU de alto rendimiento ahora puede ejecutarse de manera eficiente en una sola GPU de bajo costo. Este logro allana el camino para implementar sistemas complejos de IA "agénticos" en dispositivos de borde como teléfonos inteligentes, controladores industriales y computadoras automotrices, proporcionando baja latencia, alta privacidad y una reducción radical en el consumo de energía.

« Volver a la Lista de Noticias