
YOLOv11のC3k2モジュールを基にした、改良されたC3k2_DWRおよびC3k2_SIRモジュールを示すネットワーク構造図を生成してください。両方のモジュールを1つの図に、垂直または水平に配置して示してください。図のスタイルは、CVPRなどのトップレベルのコンピュータビジョン学術誌の基準に準拠し、学術論文の構造的慣例に従ってください。具体的な改善点は以下のテキストに詳述されています。 C3k2_DWRおよびC3k2_SIRモジュールの中心となるアイデアは、元のC3K2モジュールのBottleneck内の標準的な畳み込み層を、強化されたコンポーネントに置き換えることです。具体的には、C3k2_DWRはBottleneckのcv1とcv2の間にDWRモジュールを埋め込みます。このDWRモジュールは、元の単一の3x3畳み込みを、領域残差化(グローバルプーリング+1x1畳み込み)とセマンティック残差化(マルチブランチのdepthwise separable dilated convolution)を連結した構造に置き換えます。これにより、深い特徴パス上でマルチスケールのコンテキスト情報を明示的に集約し、オクルージョン推論を強化します。一方、C3k2_SIRは、同じ場所にSIRモジュールを埋め込みます。このモジュールは、depthwise convolutionを通じて空間的な詳細を抽出し、チャネル注意機構を使用してそれらを再調整し、エッジ応答を相乗的に強化します。軽量なバックボーンによって失われたテクスチャと輪郭の情報を回復するために、ミッドレイヤーの特徴パス用に特別に設計されています。どちらのモジュールも、C3K2のデュアルブランチトポロジーと残差接続フレームワークを維持し、Bottleneck内でのみターゲットを絞った強化を実装します。 DWRおよびSIRモジュールの具体的な構造については、以下のテキストを参照してください。詳細を補完するために、関連情報を自分で収集することもできます(元のDWRSeg論文など)。 DWRモジュールは、2段階の構造を採用しています。まず、領域残差化(グローバル平均プーリング+1x1畳み込み)を通じてグローバルコンテキストを抽出します。次に、セマンティック残差化(マルチブランチのdepthwise separable dilated convolution、設定可能なdilation rateを使用)を介して、マルチスケールのローカル特徴をキャプチャします。最後に、特徴を融合し、残差接続を追加します。SIRモジュールは、軽量な設計を採用しています。まず、depthwise convolutionを通じて空間的な詳細を強化し、次に、チャネル注意機構(squeeze-and-excitation構造)を使用して特徴の重要度を再調整し、エッジをシャープにします。どちらのモジュールも、同じ入力および出力次元を維持し、プラグアンドプレイによる特徴の強化を可能にします。
時系列補完の学習プロセスを示す模式図。グリッド状のマトリックスは多変量時系列を表し、行は時間ステップ、列は変数を表す。マ...