Схематическая диаграмма, иллюстрирующая рабочий процесс модели, начинающийся с траектории транспортного средства и сцены восприятия окружающей среды слева. Диаграмма изображает светло-серую плоскость дороги с несколькими цветными значками автомобилей (красный представляет автомобиль пользователя, синий/зеленый представляют окружающие автомобили). Историческая траектория автомобиля пользователя обозначена толстой сплошной стрелкой, а динамическая зона влияния окружающих автомобилей заключена в пунктирные круги. Дорожные структуры, такие как линии разметки, перекрестки и светофоры, отмечены тонкими серыми линиями или небольшими значками. В целом, входные данные системы состоят из мультимодальных данных наблюдения, включающих исторический путь автомобиля пользователя, состояния движения соседних транспортных средств и статическую топологию дороги. Далее, он поступает во второй этап: модуль извлечения признаков, который разделен на два параллельных пути: пространственно-временные признаки взаимодействия и признаки намерения водителя. Верхний путь предназначен для извлечения пространственно-временных признаков взаимодействия: Исторические координаты автомобиля пользователя (x_t, y_t) вводятся в набор из трех синих 3D кубических блоков, представляющих GRU энкодер, с надписью "Временной признак взаимодействия", выводя временной признак f_e^t; одновременно, окружающие транспортные средства и дорожные структуры вводятся в набор желтых 3D кубических блоков, представляющих графовую сеть внимания GAT, с надписью "Пространственный признак взаимодействия", выводя пространственный признак f_e^s. Они объединяются через зеленый трапециевидный модуль с надписью "Concat(f_e^t, f_e^s)", в конечном итоге выводя внешний признак взаимодействия f_e. Нижний путь предназначен для извлечения признаков намерения водителя: Историческая траектория X вводится в оранжевый прямоугольный блок с надписью "Декодер назначения", выводя прогнозируемое назначение D̂; затем признаки извлекаются через два параллельных прямоугольных модуля: светло-голубой прямоугольник с надписью "Исторический признак (f_his)" и светло-фиолетовый прямоугольник с надписью "Признак назначения (f_des)", с помощью MLP; затем они отправляются в зеленый трапециевидный модуль с надписью "Слияние внимания", с неявной формулой механизма внимания QKV внутри, выводя объединенный признак намерения водителя f_in. Третий этап - модуль слияния пространственно-временных признаков: f_in и f_e объединяются в смешанный признак h_fus, который вводится в темно-синий трапециевидный модуль с надписью "Модуль слияния Mamba", использующий архитектуру Mamba для эффективного моделирования долгосрочных зависимостей, выводя окончательный объединенный признак f_fus. Визуально этот модуль можно дополнить волнистыми текстурами или символом "M", чтобы подчеркнуть его возможности моделирования последовательностей. Четвертый этап - модуль генерации шума, управляемый условиями: f_fus вводится в два параллельных оранжевых трапециевидных модуля, левый с надписью "Декодер среднего (μ̄_θ)", а правый с надписью "Декодер стандартного отклонения (σ̄_θ)", которые вместе определяют управляемое распределение шума; выход подключен к прямоугольному блоку с волнистым текстурированным фоном с надписью ""
Диаграмма, иллюстрирующая рабочий процесс модели, начинающий...