
弱教師ありセマンティックセグメンテーションのアーキテクチャ図。 この図は、画像レベルのラベルを利用した弱教師ありセマンティックセグメンテーションのシングルステージ手法を示しています。ワークフローは、以下の段階を経て水平方向に進みます。 1. 入力段階: * 入力画像: 画像レベルのアノテーションが付与された画像。 * 革新点: 位置特定に特化したトークンが入力層に組み込まれています (オレンジ色で強調表示)。 * 革新点: より小さなパッチクラスタリングモジュールが採用されています (オレンジ色で強調表示)。 2. 特徴抽出段階: * バックボーンネットワーク: セグメンテーションバックボーンネットワークが入力から特徴マップを抽出します。 * 革新点: アダプターモジュールがバックボーンネットワークに統合されています (シアン色で強調表示)。 3. デュアルブランチ処理: * 上部ブランチ: 分類ヘッドが特徴を処理し、分類損失 (Lcls) を生成します。 * 下部ブランチ: このブランチは2つのパスに分岐します。 * パスa: デコーダーが予測セグメンテーションマップを生成します。 * パスb: 疑似ラベルジェネレーターが疑似ラベルを作成します。 4. 教師あり段階: * 予測セグメンテーションマップと生成された疑似ラベルの間で、クロスエントロピー損失 (Lce) が計算されます。
改善されたYOLO11s-segアーキテクチャの図を、可能な限り多くのネットワーク構造層を正確な構造の詳細とともに示して...