Google Cloud AI Platform
Интеграции
- BigQuery (Zero-copy)
- Apigee API Registry
- Salesforce Agentforce (A2A)
- ServiceNow (A2A)
- NVIDIA NeMo
- Ray на Vertex AI
Детали цены
- Оплата основана на потреблении токенов (API Gemini), времени работы вычислительных узлов (vCPU/GPU/TPU) и использовании Flex-Start VM.
- Интеграция с Google Search тарифицируется отдельно с января 2025 года.
Возможности
- Стабильные модели Gemini 3 и 2.5
- Vertex AI Agent Builder (A2A и MCP)
- Model Garden (200+ базовых моделей)
- Dynamic Workload Scheduler (Flex-Start VM)
- Memory Bank движка агентов и выполнение кода
- Корпоративная безопасность (Model Armor и частные VPC)
Описание
Обзор архитектуры Vertex AI и инфраструктуры агентной оркестрации
Версия Vertex AI 2026 выступает в роли слоя агентной оркестрации, основанного на Vertex AI Agent Builder и открытом протоколе Agent-to-Agent (A2A). Этот стандарт позволяет агентам Vertex взаимодействовать безопасно с агентами внешних экосистем (Salesforce, ServiceNow, UiPath) независимо от базового фреймворка 📑.
Оркестрация моделей и агентный ИИ
Model Garden предоставляет курированную библиотеку из 200+ базовых моделей, включая последние стабильные релизы Gemini 3 и Gemini 2.5.
- Мультимодальная ингестия в реальном времени: Вход: Потоки аудио/видео в реальном времени → Процесс: Инференс с низкой задержкой через Gemini Live 2.5 Flash API → Выход: Контекстно-зависимые мультимодальные ответы с задержкой менее секунды 📑.
- A2A-оркестрация: Вход: Высокоуровневая цель, требующая кросс-платформенных данных → Процесс: Супервизорный агент ведет переговоры с внешними агентами через протокол A2A и инструменты ApiRegistry → Выход: Автономное выполнение задач в гетерогенных экосистемах 📑.
- Тонкая настройка Model Garden: Поддерживает управляемую LoRA и полную доменную специализацию для Gemini и открытых моделей, таких как Llama 4; однако приоритеты планирования на аппаратном уровне в AI Hypercomputer остаются нераскрытыми 🌑.
⠠⠉⠗⠑⠁⠞⠑⠙⠀⠃⠽⠀⠠⠁⠊⠞⠕⠉⠕⠗⠑⠲⠉⠕⠍
Инфраструктура и слой доверия
Архитектура 2026 года использует аппаратное обеспечение TPU v5p и Dynamic Workload Scheduler (DWS) для эффективного распределения ресурсов.
- Flex-Start VMs в DWS: Обеспечивает оптимизированный по стоимости инференс для краткосрочных рабочих нагрузок, планируя мощности на зарезервированных кластерах ускорителей в периоды простоя 📑.
- Движок агентов и Memory Bank: Предлагает управляемую среду выполнения с постоянным «Memory Bank» для долгосрочного сохранения контекста агентов и выполнения кода в изолированных песочницах 📑.
- Защитные механизмы безопасности: Интегрирует Model Armor для защиты от промпт-инъекций и Private Service Connect для развертывания агентов в изолированных VPC 📑.
Рекомендации по оценке
Техническим экспертам следует проверить следующие архитектурные характеристики:
- Задержка A2A-переговоров: Измерить накладные расходы на установление соединения и согласование возможностей между агентами Vertex AI и сторонними A2A-совместимыми фреймворками 🌑.
- Доступность Flex-Start VM: Проверить типичное время ожидания выделения Flex-Start VM в различных географических зонах для соответствия SLA пакетного инференса 🧠.
- Управление инструментами: Провести аудит конфигурации ApiRegistry, чтобы убедиться в соответствии инструментов, доступных агентам, корпоративным политикам безопасности и доступа к данным 📑.
История обновлений
Итоговое обновление года: релиз Autonomous Model Hub. Более 500 открытых и проприетарных моделей с автоматической донастройкой под отраслевые задачи.
Общий релиз Gemini 1.5 Pro с контекстным окном в 2 млн токенов. Улучшенное многомодальное рассуждение и поддержка анализа аудио.
Запуск Agent Builder. Среда с низким уровнем кода для создания и развертывания ИИ-агентов, обученных на корпоративных данных (RAG).
Интеграция семейства Gemini. В Vertex AI добавлены многомодальные возможности (текст, изображения, видео, код) с безопасностью корпоративного уровня.
Внедрение поддержки GenAI. Запущен Model Garden с моделями PaLM 2, Imagen и Codey. Выпущена Generative AI Studio.
Масштабный сдвиг: запуск Vertex AI. Объединение AI Platform и AutoML в единый интерфейс и API. Внедрены Pipelines и Feature Store.
Ребрендинг в AI Platform. Представлены AI Platform Notebooks и сервис разметки данных для поддержки полного жизненного цикла ML.
Первоначальный запуск Google Cloud Machine Learning Engine. Предоставлено управляемое обучение и прогнозирование на TensorFlow в масштабе.
Плюсы и минусы инструмента
Плюсы
- Масштабируемая ML-инфраструктура
- Интегрированные ML-инструменты
- Поддержка нескольких фреймворков
- Простая интеграция с Python
- Автоматизированная разработка моделей
- Развертывание в реальном времени
- Надежная обработка данных
- Упрощенное обучение
Минусы
- Сложная настройка
- Возможные затраты
- Зависимость от поставщика