
Diagramma architetturale per la segmentazione semantica debolmente supervisionata. Questo diagramma illustra un metodo a singola fase per la segmentazione semantica debolmente supervisionata che utilizza etichette a livello di immagine. Il flusso di lavoro procede orizzontalmente attraverso le seguenti fasi: 1. Fase di Input: * Immagine di Input: Un'immagine accompagnata da annotazioni di etichette a livello di immagine. * Innovazione: Token specifici per la localizzazione sono incorporati nel livello di input (evidenziati in arancione). * Innovazione: Viene impiegato un modulo di clustering di patch più piccolo (evidenziato in arancione). 2. Fase di Estrazione delle Caratteristiche: * Rete Backbone: Una rete backbone di segmentazione estrae mappe di caratteristiche dall'input. * Innovazione: Moduli adattatori sono integrati nella rete backbone (evidenziati in ciano). 3. Elaborazione a Doppio Branch: * Branch Superiore: Un head di classificazione elabora le caratteristiche, risultando in una perdita di classificazione (Lcls). * Branch Inferiore: Questo branch si biforca in due percorsi: * Percorso a: Un decoder genera una mappa di segmentazione prevista. * Percorso b: Un generatore di pseudo-etichette crea pseudo-etichette. 4. Fase di Supervisione: * Una perdita di cross-entropia (Lce) viene calcolata tra la mappa di segmentazione prevista e le pseudo-etichette generate.
Si prega di fornire un diagramma dell'architettura migliorat...