Amazon Rekognition (Объекты)
Интеграции
- Amazon Bedrock (Nova)
- Amazon Kinesis Video Streams
- AWS Step Functions
- AWS Agentic Foundry
- Amazon S3 (векторно-пространственный индекс)
Детали цены
- Стандартный анализ тарифицируется за каждые 1000 изображений.
- Потоки видео тарифицируются за минуту.
- Обновления 2026 года включают кредиты 'Агентского рабочего процесса' для автоматизированной оркестрации Step Function.
Возможности
- Обнаружение объектов и сцен (v4)
- Оценка 3D-вершин и глубины
- Логические триггеры агентского зрения
- Интеграция с Kinesis Video в реальном времени
- Генеративная интерпретация сцен (Bedrock)
- Трансферное обучение для пользовательских меток (GA)
Описание
Amazon Rekognition 2026: Пространственно-агентское зрение и аудит AI Foundry
По состоянию на 13 января 2026 года Amazon Rekognition завершил переход к пространственному интеллекту. Архитектура использует кластеры AWS Inferentia 3 для обеспечения высокоточной оценки 3D-ограничивающих рамок и генеративной интерпретации сцен, выступая в качестве основного визуального сенсорного слоя для автономных агентов 📑.
Пространственный интеллект и 3D-оркестрация
Основной движок использует монокулярную оценку глубины в сочетании с многовидовой геометрией для возврата нормализованных 3D-вершин визуальных объектов, что позволяет проводить точный объемный анализ в складских и охранных средах 📑.
- Сценарий логистической эффективности: Вход: поток 4K-видео с автоматических сортировщиков → Процесс: 3D-локализация объектов + расчет объема через Inferentia 3 → Выход: команды оптимизации пространства на полках в реальном времени в AWS Step Functions 📑.
- Сценарий опасных зон: Вход: статичные изображения с дронов промышленной площадки → Процесс: API DetectProtectiveEquipment с валидацией пространственной глубины → Выход: предупреждения о безопасности с высокой степенью уверенности и 3D-координатным картированием 📑.
⠠⠉⠗⠑⠁⠞⠑⠙⠀⠃⠽⠀⠠⠁⠊⠞⠕⠉⠕⠗⠑⠲⠉⠕⠍
Персистентность и инфраструктура Inferentia 3
Система использует векторно-пространственный слой персистентности, оптимизированный для субсекундного извлечения визуальных паттернов из озер данных S3 объемом в несколько петабайт. Хотя веса инференса являются проприетарными, архитектура развертывания поддерживает изоляцию VPC и локальную региональную обработку для обеспечения суверенитета данных 🧠.
- Генеративное заземление: Метаданные визуальных объектов направляются в Amazon Bedrock, где модели Nova преобразуют сырые метки в структурированные отчеты на естественном языке с цитатами аудиторского следа 📑.
- Прозрачность моделей: Внутренние нейронные топологии и конкретные наборы данных для обучения 'Custom Labels' остаются закрытыми для предотвращения конкурентного реверс-инжиниринга 🌑.
Рекомендации по оценке
Техническим экспертам следует проверить следующие архитектурные характеристики:
- Точность оценки глубины: Провести бенчмаркинг точности координат по оси Z в условиях переменного освещения, так как монокулярная оценка глубины чувствительна к высококонтрастным окклюзиям [Documented].
- Задержка агентских триггеров: Измерить сквозное время отклика (RTT) от визуального события Kinesis до инициации рабочего процесса Step Function для обеспечения соответствия критически важным SLA [Unknown].
- Паритет суверенного хостинга: Убедиться, что API 3D-оценки полностью функционируют в регионах за пределами США, особенно с учетом флагов резидентности данных в ЕС и Японии [Inference].
История обновлений
Итоговое обновление года: релиз Agentic Vision. Rekognition теперь может автономно запускать рабочие процессы в AWS Step Functions на основе сложных визуальных событий.
Общая доступность функций Spatial. 3D-ограничивающие рамки и оценка расстояния между объектами с использованием стандартных 2D-камер.
Интеграция с Amazon Bedrock. Позволяет выполнять поиск на естественном языке по библиотекам изображений/видео и создавать генеративные описания визуальных данных.
Добавлено обнаружение Face Liveness для предотвращения подмены лиц. Улучшено определение свойств объектов (цвет, текстура, материал).
Значительное обновление модерации контента. Улучшена точность обнаружения небезопасного контента и внедрены иерархические метки модерации.
Запуск Rekognition Custom Labels. Позволяет пользователям обучать модели распознаванию специфических объектов (напр., запчастей, логотипов) на малом объеме данных.
Расширение на видео. Анализ видео в реальном времени и пакетном режиме для отслеживания людей и обнаружения объектов в движении.
Первоначальный запуск. Облачный анализ изображений для обнаружения объектов и сцен, распознавания лиц и идентификации знаменитостей.
Плюсы и минусы инструмента
Плюсы
- Высокая точность
- Масштабируемость и надежность
- Точная локализация
- Простая интеграция API
- Широкий охват категорий
Минусы
- Возможная высокая стоимость
- Зависимость от качества
- Требуются знания AWS