Главная > Категории > Машинное обучение и нейросети > Развертывание моделей > Akamai Cloud Inference

Akamai Cloud Inference

Похожие Преимущества / Недостатки YouTube

Маркетинговые бенчмарки заявляют о снижении затрат на рабочие нагрузки инференса до 86% по сравнению с AWS.
Стандартное выставление счетов основано на потреблении ресурсов (циклы GPU/CPU) и передаче данных.

Возможности

Инфраструктура NVIDIA Blackwell (RTX 6000)
Интеграционный слой VAST Data
Поддержка мультимодельного инференса
Оптимизация агентных и физических рабочих нагрузок ИИ
Периферийное посредничество конфиденциальности
Обработка видео на ASIC VPU
Унифицированный управляемый уровень персистентности

Видео обзоры

Описание

Анализ архитектуры Akamai Cloud Inference

Архитектура Akamai Inference Cloud представляет собой стратегическое развёртывание специализированных вычислительных ресурсов — в частности, графических процессоров NVIDIA Blackwell (RTX 6000) и ASIC VPU — на базе глобальной магистральной сети первого уровня 📑. Эта инфраструктура разработана для устранения узких мест производительности, характерных для централизованных гипермасштабных моделей, путём обработки данных на периметре сети, что снижает требования к обратной передаче данных и минимизирует физическое расстояние до конечного пользователя.

Базовая инфраструктура и уровень данных

Возможности платформы по работе с большими объёмами данных обеспечиваются стратегическим партнёрством с VAST Data, предоставляющим унифицированный уровень хранения, оптимизированный для высококонкурентных рабочих нагрузок ИИ 📑. Эта интеграция позволяет осуществлять доступ к данным в реальном времени во время инференса, поддерживая сложные механизмы retrieval-augmented generation (RAG) и динамическое внедрение контекста на границе сети.

Вычислительная фабрика: Использует комбинацию ресурсов CPU, GPU и ASIC для соответствия специфическим требованиям рабочих нагрузок 📑.
Производительность на границе: Сообщается о снижении задержки до 2,5 раз по сравнению с традиционными централизованными облаками за счёт устранения многоэтапной маршрутизации к основным центрам обработки данных 📑.
Абстракция хранения: Управляемый уровень персистентности, интегрированный с VAST, обеспечивает необходимую пропускную способность для крупномасштабных весов моделей и журналов инференса с высокой нагрузкой 📑.

⠠⠉⠗⠑⠁⠞⠑⠙⠀⠃⠽⠀⠠⠁⠊⠞⠕⠉⠕⠗⠑⠲⠉⠕⠍

Конфиденциальность и безопасность архитектуры

Безопасность обеспечивается распределённым посредническим слоем, изолирующим среды выполнения от глобального сетевого ядра 🧠. Это позволяет локально обрабатывать конфиденциальные данные, такие как биометрические или частные видеопотоки, без передачи исходной информации по каналам дальней связи.

Изоляция данных: Реализация эфемерных контейнеров или изолированных сред процессов обеспечивает соблюдение требований к резидентности данных на уровне периферийных узлов 🧠.
Контроль доступа: Применяются многоуровневые протоколы доступа для управления внутренними представлениями моделей и посредническими процессами 🌑.

История обновлений

Early Traction & Edge AI Use Cases 2025-11-05

Akamai Inference Cloud набирает популярность с кейсами, такими как анализ видео в реальном времени (Monks) и AI-примерочные для мобильного шопинга. Платформа позволяет создавать пользовательские примерочные с локальной обработкой фото/видео, демонстрируя потенциал граничного AI для персонализированных приложений в реальном времени. Akamai сообщает о росте спроса после дебюта на конференции NVIDIA GTC.

Akamai Inference Cloud with NVIDIA 2025-10-28

Запуск Akamai Inference Cloud в партнёрстве с NVIDIA, переосмысливающий развёртывание AI с ядра дата-центров до границы сети. Использует инфраструктуру NVIDIA Blackwell для масштабируемого, безопасного и низколатентного вывода моделей по всему миру. Поддерживает агентские и физические AI-нагрузки, обеспечивая принятие решений в реальном времени и персонализированные взаимодействия. Ранние кейсы: анализ видео в реальном времени (Monks для мультикамерных потоков) и AI-примерочные для мобильного шопинга.

Akamai Cloud Inference (Official Launch) 2025-03-27

Официальный запуск Akamai Cloud Inference — платформы для создания и выполнения AI-приложений и ресурсоёмких нагрузок на границе сети. Обеспечивает в 3 раза лучшую пропускную способность и до 2.5 раз меньшую задержку по сравнению с традиционными гиперскейлерами. Экономия до 86% на нагрузках вывода моделей. Поддерживает предиктивные модели и LLM, предлагая гибкие вычислительные опции (CPU, GPU, ASIC VPU) и интеграцию с VAST Data для доступа к данным в реальном времени.

v2.2 2025-08

Улучшенные методы сжатия моделей для снижения использования полосы пропускания. Улучшенная наблюдаемость с подробными показателями производительности. Поддержка моделей WebAssembly.

2025 Update - Spring 2025-04

Представлено многомодельное заключение. Поддержка генеративных моделей ИИ (текст в изображение). Расширенная поддержка платформ граничных вычислений.

v2.1 2024-11

Добавлена поддержка моделей TensorFlow Lite. Улучшены возможности версионирования и отката моделей. Улучшенный API для управления моделями.

2024 Update - Summer 2024-07

Добавлена поддержка моделей видеоаналитики. Снижена задержка на 15% благодаря оптимизированному кэшированию на границе сети. Интеграция с Akamai Identity Cloud.

v2.0 2024-03

Представлена динамическая масштабируемость. Поддержка пользовательских контейнеров моделей. Улучшенные функции безопасности с расширенным шифрованием данных.

v1.1 2023-12

Добавлена поддержка моделей PyTorch. Улучшены возможности мониторинга и ведения журналов.

v1.0 (GA) 2023-09

Выпуск в общую доступность. Расширенное географическое покрытие. Улучшенные инструменты развертывания моделей.

v1.0 (Beta) 2023-06

Первый релиз Beta. Поддержка моделей классификации изображений и обнаружения объектов. Ограниченная географическая доступность.

Плюсы и минусы инструмента

Плюсы

Низкая задержка
Масштабируемость
Глобальная сеть
Простая интеграция
Улучшенный UX

Минусы

Зависимость от поставщика
Высокая стоимость

Akamai Cloud Inference

Теги

Интеграции

Детали цены

Возможности

Видео обзоры

Описание

Анализ архитектуры Akamai Cloud Inference

Базовая инфраструктура и уровень данных

Конфиденциальность и безопасность архитектуры

Рекомендации по оценке

История обновлений

Плюсы и минусы инструмента

Плюсы

Минусы

Akamai Cloud Inference

Теги

Интеграции

Детали цены

Возможности

Видео обзоры

Описание

Анализ архитектуры Akamai Cloud Inference

Базовая инфраструктура и уровень данных

Конфиденциальность и безопасность архитектуры

Рекомендации по оценке

История обновлений

Плюсы и минусы инструмента

Плюсы

Минусы

Похожие инструменты, которые могут быть полезны

TensorFlow

PyTorch

Amazon SageMaker

Databricks

Google Cloud AI Platform

Azure Machine Learning

Сообщить об ошибке