Компания Red Hat 17 октября 2025 года анонсировала выход Red Hat AI 3, новой версии своей корпоративной платформы для разработки и развертывания ИИ. Ключевым нововведением стала поддержка распределенного вывода (distributed inference) с помощью модуля llm-d. Эта технология позволяет "разбивать" одну большую языковую модель на части и выполнять их параллельно на нескольких серверах или GPU. Такой подход решает проблему запуска гигантских моделей, которые не помещаются в память одного ускорителя, и делает процесс вывода (inference) более масштабируемым и экономически эффективным. Платформа также закладывает основу для создания агентных систем, предлагая унифицированный API для взаимодействия с моделями. Red Hat AI 3 нацелена на компании, которые переходят от экспериментов с ИИ к его полноценному использованию в производственных процессах и нуждаются в надежном и управляемом решении.
Red Hat представляет платформу Red Hat AI 3 с поддержкой распределенного вывода