
Architekturdiagramm für schwach überwachte semantische Segmentierung. Dieses Diagramm veranschaulicht eine einstufige Methode für schwach überwachte semantische Segmentierung unter Verwendung von Bild-Level-Labels. Der Workflow verläuft horizontal durch die folgenden Phasen: 1. Eingabephase: * Eingabebild: Ein Bild, begleitet von Bild-Level-Label-Annotationen. * Innovation: Lokalisierungsspezifische Token werden in die Eingabeschicht integriert (orange hervorgehoben). * Innovation: Ein kleineres Patch-Clustering-Modul wird verwendet (orange hervorgehoben). 2. Merkmalsextraktionsphase: * Backbone-Netzwerk: Ein Segmentierungs-Backbone-Netzwerk extrahiert Feature Maps aus der Eingabe. * Innovation: Adaptermodule sind in das Backbone-Netzwerk integriert (cyan hervorgehoben). 3. Dual-Branch-Verarbeitung: * Oberer Zweig: Ein Klassifikations-Head verarbeitet Features, was zu einem Klassifikationsverlust (Lcls) führt. * Unterer Zweig: Dieser Zweig verzweigt sich in zwei Pfade: * Pfad a: Ein Decoder generiert eine vorhergesagte Segmentierungskarte. * Pfad b: Ein Pseudo-Label-Generator erzeugt Pseudo-Labels. 4. Überwachungsphase: * Ein Cross-Entropy-Verlust (Lce) wird zwischen der vorhergesagten Segmentierungskarte und den generierten Pseudo-Labels berechnet.
Bitte erstellen Sie ein Diagramm der verbesserten YOLO11s-se...