Создайте схему сетевой структуры, иллюстрирующую улучшенные модули C3k2_DWR и C3k2_SIR, основанные на модуле C3k2 в YOLOv11. Представьте оба модуля на одной диаграмме, расположенных вертикально или горизонтально. Стиль диаграммы должен соответствовать стандартам ведущих научных журналов по компьютерному зрению, таких как CVPR, и соответствовать структурным соглашениям научных работ. Конкретные улучшения подробно описаны в следующем тексте: Основная идея модулей C3k2_DWR и C3k2_SIR заключается в замене стандартных сверточных слоев внутри Bottleneck оригинального модуля C3K2 улучшенными компонентами. В частности, C3k2_DWR встраивает модуль DWR между cv1 и cv2 в Bottleneck. Этот модуль DWR заменяет исходную одинарную свертку 3x3 структурой, которая объединяет региональную резидуализацию (глобальный пулинг + свертка 1x1) и семантическую резидуализацию (многоканальная depthwise separable dilated convolution). Это явно агрегирует многомасштабную контекстную информацию на путях глубоких признаков для улучшения рассуждений об окклюзии. C3k2_SIR, с другой стороны, встраивает модуль SIR в том же месте. Этот модуль извлекает пространственные детали с помощью depthwise convolution, а затем перекалибрует их с использованием канального внимания, синергетически усиливая отклики краев. Он специально разработан для путей признаков среднего уровня, чтобы восстановить текстуру и контурную информацию, потерянную облегченными бэкбонами. Оба модуля поддерживают двухканальную топологию и структуру остаточного соединения C3K2, реализуя только целевые улучшения внутри Bottleneck. Для конкретной структуры модулей DWR и SIR, пожалуйста, обратитесь к следующему тексту. Вы также можете собрать соответствующую информацию самостоятельно (например, оригинальную статью DWRSeg), чтобы дополнить детали. Модуль DWR использует двухэтапную структуру: сначала он извлекает глобальный контекст посредством региональной резидуализации (глобальный average pooling + свертка 1x1). Затем он захватывает многомасштабные локальные признаки с помощью семантической резидуализации (многоканальная depthwise separable dilated convolution с настраиваемыми коэффициентами дилатации). Наконец, он объединяет признаки и добавляет остаточное соединение. Модуль SIR использует облегченную конструкцию: сначала он усиливает пространственные детали с помощью depthwise convolution, а затем перекалибрует важность признаков с использованием механизма канального внимания (структура squeeze-and-excitation) для заострения краев. Оба модуля поддерживают одинаковые входные и выходные размеры, обеспечивая возможность plug-and-play улучшения признаков.

Робот-собака автоматически маркирует объекты окружающей сред...