Inicio > Categorías > Visión por Computadora > Detección de Objetos > YOLO (You Only Look Once)

YOLO (You Only Look Once)

Relacionados Ventajas y Desafíos

Etiquetas

Visión-por-Computadora IA-en-Tiempo-Real Computación-de-Borde Detección-de-Objetos Sin-NMS

Integraciones

PyTorch 2.6+
TensorRT 11.5
OpenVINO 2026.1
ONNX Runtime Agentic
Plataforma Aitocore Guardrail

Categorías:
Visión por Computadora Aprendizaje Automático y Redes Neuronales
Creador Различные исследователи
Fecha 2016-05-09
Plataformas Frameworks
Estado Active (Development)
Sitio web github.com
Modelo de precios Gratis
Secciones:
Frameworks de DL Análisis de Imágenes Segmentación de Imágenes Detección de Objetos Reconocimiento de Objetos Análisis de Video

Detalles de precios

Los pesos de investigación principales están disponibles bajo licencias de código abierto.
Los pesos optimizados para NPU de grado empresarial para hardware especializado (nativo de Foundry) requieren un acuerdo de licencia basado en créditos.

Características

Asignación Dual Consistente para inferencia sin NMS
Dorsal Híbrida LPSA CNN-Atención
Cabezas de detección sin anclaje
Dinámica de pérdida de clasificación consciente de IoU
Cuantización INT8 optimizada para NPU
Aumento Mosaic y Mixup v4

Descripción

YOLO: Detección en tiempo real sin NMS y auditoría de atención híbrida (v.2026)

A partir de enero de 2026, la línea YOLO (You Only Look Once) ha alcanzado un hito de Procesamiento Posterior Cero. La arquitectura, estandarizada en torno a los protocolos YOLOv12, utiliza una estrategia de Asignación Dual Consistente. Este mecanismo proporciona una supervisión uno-a-muchos durante el entrenamiento, mientras emplea correspondencia uno-a-uno para la inferencia, eliminando efectivamente la etapa de Supresión No Máxima (NMS) y su sobrecarga computacional asociada 📑.

Lógica de la tubería de detección y la dorsal híbrida

El sistema utiliza un modelo de regresión basado en una cuadrícula $S \times S$, integrado con módulos de Auto-Atención Parcial Ligera (LPSA). Este enfoque híbrido permite capturar dependencias espaciales de largo alcance, manteniendo al mismo tiempo las características de baja latencia de los extractores de características convolucionales 🧠.

Escenario de robótica de borde: Entrada: Secuencia estéreo-visión en bruto a 120 fps → Proceso: Extracción de características LPSA + regresión de cabeza sin NMS → Salida: Coordenadas espaciales 3D en tiempo real para evitación de colisiones 📑.
Escenario de inspección industrial: Entrada: Imágenes de alta resolución de una cinta transportadora → Proceso: Inferencia INT8 acelerada por NPU con pérdida de clasificación consciente de IoU → Salida: Localización instantánea de defectos submilimétricos 🧠.

⠠⠉⠗⠑⠁⠞⠑⠙⠀⠃⠽⠀⠠⠁⠊⠞⠕⠉⠕⠗⠑⠲⠉⠕⠍

Optimización de datos y dinámica de pérdida

Para soportar aceleradores de borde de grado 2026, YOLO emplea Cuantización Consciente de NPU ($INT8/FP16$). La arquitectura de la función de pérdida ha sido reestructurada para priorizar la 'Alineación de Objetividad', minimizando la divergencia entre la precisión de localización ($IoU$) y las puntuaciones de confianza de clase 📑.

Guía de evaluación

Los evaluadores técnicos deben verificar las siguientes características arquitectónicas:

Ganancia de latencia sin NMS: Medir el tiempo total de ida y vuelta (RTT) en el hardware objetivo para verificar la aceleración del 20-25% obtenida al eliminar la etapa de post-procesamiento [Documented].
Sincronización Atención-CNN: Validar el rendimiento del módulo LPSA en escenas densas para asegurar que se capturan las dependencias de largo alcance sin deriva semántica [Inference].
Fidelidad de cuantización: Solicitar métricas de caída de precisión para pesos INT8 frente a FP32, centrándose específicamente en el mAP (Precisión Media Promedio) para objetos pequeños en entornos de bajo contraste [Unknown].

Historial de versiones

YOLO Edge-Agent Update 2025-12

Actualización de fin de año: enfoque en Vision Agéntica para la toma de decisiones autónoma.

YOLOv12 (Attention-Centric) 2025-02

Introducción de YOLOv12 con capas de auto-atención para capturar dependencias globales.

YOLO11 2024-09

Lanzamiento de YOLO11 con arquitectura optimizada y mayor eficiencia.

YOLOv10 (NMS-free) 2024-05

Introducción del entrenamiento sin NMS, reduciendo significativamente la latencia de inferencia.

YOLOv8 2023-01

Nuevo modelo SOTA de Ultralytics. Detección sin anclas y marco unificado.

YOLOv5 (Ultralytics) 2020-05

Primera implementación en PyTorch e introducción de AutoAnchor.

YOLOv3 2018-04

Introducción de Darknet-53 y predicciones multiescala.

YOLOv1 2016-04

Lanzamiento inicial de Joseph Redmon. Detección de objetos en tiempo real como un único problema de regresión.

Ventajas y desventajas de la herramienta

Ventajas

Detección extremadamente rápida
Diseño eficiente
Gran comunidad
Tamaños de modelo flexibles
Apto para móviles

Desventajas

Requiere GPU potente
Entrenamiento con datos
Precisión limitada

YOLO (You Only Look Once)

Etiquetas

Integraciones

Detalles de precios

Características

Descripción

YOLO: Detección en tiempo real sin NMS y auditoría de atención híbrida (v.2026)

Lógica de la tubería de detección y la dorsal híbrida

Optimización de datos y dinámica de pérdida

Guía de evaluación

Historial de versiones

Ventajas y desventajas de la herramienta

Ventajas

Desventajas

Herramientas relacionadas que podrían ser útiles

SSD (Single Shot MultiBox Detector)

Segment Anything Model (SAM)

Clarifai

Google Cloud Vision AI (Objetos)

Amazon Rekognition (Objetos)

Amazon Rekognition Video

Informar de un error