Диаграмма, иллюстрирующая рабочий процесс модели, начинающийся с траектории транспортного средства и сцены восприятия окружающей среды слева. Диаграмма изображает светло-серую плоскость дороги с множеством цветных значков автомобилей (красный для эго-автомобиля, синий/зеленый для окружающих автомобилей). Историческая траектория эго-автомобиля обозначена толстой сплошной стрелкой, а динамическая зона влияния окружающих автомобилей заключена в пунктирные круги. Дорожные структуры, такие как линии разметки, отмечены тонкими серыми линиями или небольшими значками. В целом, входные данные системы состоят из мультимодальных данных наблюдения, включающих исторический путь эго-автомобиля, состояние движения соседних транспортных средств и статическую топологию дороги. Далее процесс переходит во вторую стадию: модуль извлечения признаков, который разделен на два параллельных пути: пространственно-временные признаки взаимодействия и признаки намерения водителя. Верхний путь предназначен для извлечения пространственно-временных признаков взаимодействия: Исторические координаты эго-автомобиля (x_t, y_t) вводятся в набор из трех синих 3D кубических блоков, представляющих GRU-энкодер, обозначенных как "Временной признак взаимодействия", выводя временной признак f_e^t. Одновременно окружающие транспортные средства и дорожные структуры вводятся в набор желтых 3D кубических блоков, представляющих графовую сеть внимания GAT, обозначенных как "Пространственный признак взаимодействия", выводя пространственный признак f_e^s. Они объединяются через зеленый трапециевидный модуль, обозначенный как "Concat(f_e^t, f_e^s)", в конечном итоге выводя внешний признак взаимодействия f_e. Нижний путь предназначен для извлечения признаков намерения водителя: Историческая траектория X вводится в оранжевый прямоугольный блок, обозначенный как "Декодер назначения", выводя прогнозируемое назначение D̂. Впоследствии выход проходит через два параллельных прямоугольных модуля: светло-голубой прямоугольник, обозначенный как "Признак истории (f_his)", и светло-фиолетовый прямоугольник, обозначенный как "Признак назначения (f_des)", из которых признаки извлекаются с помощью MLP. Затем эти признаки подаются в зеленый трапециевидный модуль, обозначенный как "Слияние внимания", внутренне подразумевающий формулу механизма внимания QKV, выводя объединенный признак намерения водителя f_in. Третья стадия - модуль слияния пространственно-временных признаков: f_in и f_e объединяются в смешанный признак h_fus, который вводится в темно-синий трапециевидный модуль, обозначенный как "Модуль слияния Mamba". Этот модуль использует архитектуру Mamba для эффективного моделирования долгосрочных зависимостей, выводя окончательный объединенный признак f_fus. Визуально этот модуль может включать волнистую текстуру или символ "M", чтобы подчеркнуть его возможности моделирования последовательностей. Четвертая стадия - модуль генерации шума, управляемый условиями: f_fus вводится в два параллельных оранжевых трапециевидных модуля, левый из которых обозначен как "Декодер среднего (μ̄_θ)", а правый - как "Декодер стандартного отклонения (σ̄_θ)". Эти два модуля совместно определяют управляемое распределение шума. Выход подключается к прямоугольному блоку с волнистым текстурированным фоном, обозначенному как "Управляемый ""
Нарисуйте технологическую дорожную карту. Технологическая до...