任务自适应、身份一致的跨模态框架 预测范围:3–5秒 输入模态A:骨骼姿态(关键点轨迹) 输入模态B:场景上下文... | SciDraw AI Gallery