![Por favor, proporcione un diagrama de la arquitectura mejorada YOLO11s-seg, mostrando tantas capas de la estructura de la red como sea posible con detalles estructurales precisos. La estructura general debe dividirse en secciones izquierda y derecha. El lado izquierdo debe ilustrar la estructura backbone mejorada, mientras que el lado derecho debe mostrar las secciones neck y head mejoradas. Cada componente estructural debe ser claro y completo. El esquema de color general debe ser de tonos cálidos, y el estilo debe asemejarse a los diagramas de estructura de red que se encuentran en artículos de conferencias o revistas de informática de primer nivel. La estructura de red mejorada se basa en las siguientes especificaciones:
Entrada: [3,640,640]
│
└─Backbone: MobileNetV4HybridMedium (factor=0.25)
│
├─Conv0: Conv2d(3→8, k=3, s=2) + BN + ReLU6 → [8,320,320]
│
├─Layer1: FusedIB(8→12, s=2) → [12,160,160] (P1)
│
├─Layer2:
│ ├─UIB(12→20, s=2) → [20,80,80]
│ └─UIB(20→20, s=1) → [20,80,80] (P2)
│
├─Layer3:
│ ├─UIB(20→40, s=2) → [40,40,40]
│ ├─UIB(40→40, s=1) → [40,40,40]
│ ├─UIB(40→40, s=1) → [40,40,40]
│ ├─4× (UIB+MHSA) → [40,40,40]
│ └─UIB(40→40, s=1) → [40,40,40] (P3)
│
└─Layer4:
├─UIB(40→64, s=2) → [64,20,20]
├─5× UIB → [64,20,20]
├─4× (UIB+MHSA) → [64,20,20]
└─2× UIB → [64,20,20] (P4)
│
└─Neck:
│
├─SPPF:
│ Conv(64→32) → 3×MaxPool → Concat → Conv(128→1024) → [1024,20,20] (P5)
│
└─C2PSA_mona ×2:
Dividido en dos ramas de 512 canales
Rama A: Conexión directa
Rama...](/_next/image?url=https%3A%2F%2Fpub-8c0ddfa5c0454d40822bc9944fe6f303.r2.dev%2Fai-drawings%2FQDBc1BIBGbvje1FqHJjm2d7CaYOob7cn%2Fcd190b7e-4df0-4d77-9c86-6989f592119d%2F9fa32595-8168-4390-8896-0d36eafa5a9f.png&w=3840&q=75)
Por favor, proporcione un diagrama de la arquitectura mejorada YOLO11s-seg, mostrando tantas capas de la estructura de la red como sea posible con detalles estructurales precisos. La estructura general debe dividirse en secciones izquierda y derecha. El lado izquierdo debe ilustrar la estructura backbone mejorada, mientras que el lado derecho debe mostrar las secciones neck y head mejoradas. Cada componente estructural debe ser claro y completo. El esquema de color general debe ser de tonos cálidos, y el estilo debe asemejarse a los diagramas de estructura de red que se encuentran en artículos de conferencias o revistas de informática de primer nivel. La estructura de red mejorada se basa en las siguientes especificaciones: Entrada: [3,640,640] │ └─Backbone: MobileNetV4HybridMedium (factor=0.25) │ ├─Conv0: Conv2d(3→8, k=3, s=2) + BN + ReLU6 → [8,320,320] │ ├─Layer1: FusedIB(8→12, s=2) → [12,160,160] (P1) │ ├─Layer2: │ ├─UIB(12→20, s=2) → [20,80,80] │ └─UIB(20→20, s=1) → [20,80,80] (P2) │ ├─Layer3: │ ├─UIB(20→40, s=2) → [40,40,40] │ ├─UIB(40→40, s=1) → [40,40,40] │ ├─UIB(40→40, s=1) → [40,40,40] │ ├─4× (UIB+MHSA) → [40,40,40] │ └─UIB(40→40, s=1) → [40,40,40] (P3) │ └─Layer4: ├─UIB(40→64, s=2) → [64,20,20] ├─5× UIB → [64,20,20] ├─4× (UIB+MHSA) → [64,20,20] └─2× UIB → [64,20,20] (P4) │ └─Neck: │ ├─SPPF: │ Conv(64→32) → 3×MaxPool → Concat → Conv(128→1024) → [1024,20,20] (P5) │ └─C2PSA_mona ×2: Dividido en dos ramas de 512 canales Rama A: Conexión directa Rama...