Nvidia готовит удар по рынку инференса

Опубликовано: 01.03.2026 00:00

28 февраля 2026 года инсайдеры слили информацию о новом чипе от Nvidia, анонс которого запланирован на грядущей конференции GTC. Компания интегрирует архитектурные подходы, аналогичные LPU (Language Processing Unit) от стартапа Groq.

Nvidia безусловно доминирует в обучении (training) нейросетей, но этап вывода (inference) — генерации ответов в реальном времени — требует иной математики. Традиционные GPU здесь избыточны и слишком дороги по затратам энергии (TCO). Внедряя "детерминированный инференс", Nvidia намерена убить двух зайцев: уничтожить появляющихся конкурентов вроде Groq на их же поле и радикально снизить стоимость API-запросов для облачных провайдеров. Это начало нового этапа ценовых войн в железе.

Источник: WSJ / Reuters

HardwareNvidiaGroqInferenceChips

« Назад к списку новостей