Anatomía de Transformers: Apple Hackea la "Caja Negra" y Abarata la Inferencia de MoE

Publicado el: 05.07.2026 01:10

El escalado ciego de parámetros está dando paso a la optimización arquitectónica. El 4 de julio de 2026, en la conferencia ICML, Apple presentó dos artículos fundamentales: `SpecMD` y `MemoryLLM`, destinados a la transparencia y rentabilidad de los modelos de IA.

El estudio SpecMD se centra en la arquitectura de Mezcla de Expertos (MoE). Los ingenieros propusieron un método de "captación previa especulativa de expertos" (speculative expert prefetching), que reduce radicalmente la latencia y los costos de inferencia para redes gigantes. El segundo artículo, MemoryLLM, aborda el problema de la interpretabilidad: Apple transforma las capas de retroalimentación de los transformers en una memoria comprensible y manejable (Plug-n-Play Interpretable Feed-Forward Memory). Estos lanzamientos muestran que Cupertino no participa en la carrera de parámetros solo por el revuelo. La compañía está diseccionando metódicamente algoritmos para hacerlos predecibles y comercialmente viables, lo cual es de vital importancia para integrar herramientas B2B en el sector real.

Fuente: Apple Machine Learning Research

I+DAppleMoETransformersInferencia

« Volver a la Lista de Noticias