Иконка инструмента

Amazon Rekognition (Объекты)

4.7 (32 голосов)
Amazon Rekognition (Объекты)

Теги

Компьютерное-зрение Агентское-зрение AWS-Foundry Глубокое-обучение Пространственный-AI

Интеграции

  • Amazon Bedrock (Nova)
  • Amazon Kinesis Video Streams
  • AWS Step Functions
  • AWS Agentic Foundry
  • Amazon S3 (векторно-пространственный индекс)

Детали цены

  • Стандартный анализ тарифицируется за каждые 1000 изображений.
  • Потоки видео тарифицируются за минуту.
  • Обновления 2026 года включают кредиты 'Агентского рабочего процесса' для автоматизированной оркестрации Step Function.

Возможности

  • Обнаружение объектов и сцен (v4)
  • Оценка 3D-вершин и глубины
  • Логические триггеры агентского зрения
  • Интеграция с Kinesis Video в реальном времени
  • Генеративная интерпретация сцен (Bedrock)
  • Трансферное обучение для пользовательских меток (GA)

Описание

Amazon Rekognition 2026: Пространственно-агентское зрение и аудит AI Foundry

По состоянию на 13 января 2026 года Amazon Rekognition завершил переход к пространственному интеллекту. Архитектура использует кластеры AWS Inferentia 3 для обеспечения высокоточной оценки 3D-ограничивающих рамок и генеративной интерпретации сцен, выступая в качестве основного визуального сенсорного слоя для автономных агентов 📑.

Пространственный интеллект и 3D-оркестрация

Основной движок использует монокулярную оценку глубины в сочетании с многовидовой геометрией для возврата нормализованных 3D-вершин визуальных объектов, что позволяет проводить точный объемный анализ в складских и охранных средах 📑.

  • Сценарий логистической эффективности: Вход: поток 4K-видео с автоматических сортировщиков → Процесс: 3D-локализация объектов + расчет объема через Inferentia 3 → Выход: команды оптимизации пространства на полках в реальном времени в AWS Step Functions 📑.
  • Сценарий опасных зон: Вход: статичные изображения с дронов промышленной площадки → Процесс: API DetectProtectiveEquipment с валидацией пространственной глубины → Выход: предупреждения о безопасности с высокой степенью уверенности и 3D-координатным картированием 📑.

⠠⠉⠗⠑⠁⠞⠑⠙⠀⠃⠽⠀⠠⠁⠊⠞⠕⠉⠕⠗⠑⠲⠉⠕⠍

Персистентность и инфраструктура Inferentia 3

Система использует векторно-пространственный слой персистентности, оптимизированный для субсекундного извлечения визуальных паттернов из озер данных S3 объемом в несколько петабайт. Хотя веса инференса являются проприетарными, архитектура развертывания поддерживает изоляцию VPC и локальную региональную обработку для обеспечения суверенитета данных 🧠.

  • Генеративное заземление: Метаданные визуальных объектов направляются в Amazon Bedrock, где модели Nova преобразуют сырые метки в структурированные отчеты на естественном языке с цитатами аудиторского следа 📑.
  • Прозрачность моделей: Внутренние нейронные топологии и конкретные наборы данных для обучения 'Custom Labels' остаются закрытыми для предотвращения конкурентного реверс-инжиниринга 🌑.

Рекомендации по оценке

Техническим экспертам следует проверить следующие архитектурные характеристики:

  • Точность оценки глубины: Провести бенчмаркинг точности координат по оси Z в условиях переменного освещения, так как монокулярная оценка глубины чувствительна к высококонтрастным окклюзиям [Documented].
  • Задержка агентских триггеров: Измерить сквозное время отклика (RTT) от визуального события Kinesis до инициации рабочего процесса Step Function для обеспечения соответствия критически важным SLA [Unknown].
  • Паритет суверенного хостинга: Убедиться, что API 3D-оценки полностью функционируют в регионах за пределами США, особенно с учетом флагов резидентности данных в ЕС и Японии [Inference].

История обновлений

Agentic Vision Hub 2025-12

Итоговое обновление года: релиз Agentic Vision. Rekognition теперь может автономно запускать рабочие процессы в AWS Step Functions на основе сложных визуальных событий.

Rekognition Spatial (v2.0) 2025-06

Общая доступность функций Spatial. 3D-ограничивающие рамки и оценка расстояния между объектами с использованием стандартных 2D-камер.

Bedrock Multimodal Integration 2024-04

Интеграция с Amazon Bedrock. Позволяет выполнять поиск на естественном языке по библиотекам изображений/видео и создавать генеративные описания визуальных данных.

Face Liveness & Properties 2023-05

Добавлено обнаружение Face Liveness для предотвращения подмены лиц. Улучшено определение свойств объектов (цвет, текстура, материал).

Content Moderation v6 2022-09

Значительное обновление модерации контента. Улучшена точность обнаружения небезопасного контента и внедрены иерархические метки модерации.

Custom Labels 2019-12

Запуск Rekognition Custom Labels. Позволяет пользователям обучать модели распознаванию специфических объектов (напр., запчастей, логотипов) на малом объеме данных.

Video Analysis Launch 2017-11

Расширение на видео. Анализ видео в реальном времени и пакетном режиме для отслеживания людей и обнаружения объектов в движении.

AWS re:Invent Launch 2016-11

Первоначальный запуск. Облачный анализ изображений для обнаружения объектов и сцен, распознавания лиц и идентификации знаменитостей.

Плюсы и минусы инструмента

Плюсы

  • Высокая точность
  • Масштабируемость и надежность
  • Точная локализация
  • Простая интеграция API
  • Широкий охват категорий

Минусы

  • Возможная высокая стоимость
  • Зависимость от качества
  • Требуются знания AWS
Chat