
該過程分為五個核心階段:資料輸入、圖形建構、特徵處理、核心計算和輸出預測,強調異質圖特徵、元路徑索引建構和節點級注意力機制的關鍵作用。以下是詳細的過程描述: 模型整體流程概述 THAN模型基於異質圖(包含使用者、級聯節點和各種關係),透過元路徑索引捕獲節點之間的語義關聯,結合時間衰減機制和多頭注意力來計算節點嵌入,最終用於級聯傳播的單步預測。該過程可分為以下5個核心階段: 1. 資料輸入和初始化 輸入資料: 異質圖資料(graph):包括節點(使用者、級聯)、邊(社交、互動、擴散)和邊屬性(例如時間戳記)。 初始特徵:使用者特徵(user_initial_features)和級聯特徵(cascade_initial_features),以字典形式儲存(id_to_idx將節點ID映射到特徵索引)。 配置參數:元路徑類型(例如,U-U-social、U-U-interact、C-U-C)、注意力頭的數量、時間衰減係數lambda_time等。 初始化操作: 裝置配置(CPU/GPU)和記憶體優化(快取清除、非同步資料傳輸)。 模型組件初始化:特徵投影層(type_transform)、多頭注意力參數(att_params)等。 2. 異質圖元路徑索引建構 使用build_metapath_index方法預先計算元路徑索引,捕獲不同類型節點和時間衰減特徵之間的關聯,以加速後續的注意力計算: 元路徑定義: U-U-social:使用者 - 社交 - 使用者(無時間戳記,僅儲存鄰居關係)。 U-U-interact:使用者 - 互動 - 使用者(儲存互動時間戳記、時間衰減值和前綴和)。 C-U-C:級聯 - 使用者 - 級聯(透過中間使用者連接的級聯關係,儲存擴散時間戳記、時間衰減值和前綴和)。 索引內容: 對於包含時間資訊的元路徑(U-U-interact、C-U-C),按節點對儲存: 排序的時間戳記列表(ts)。 時間衰減值(decay,基於1 - exp(-lambda*(t-T_earliest))計算)。 衰減值的前綴和(prefix,加速累積權重計算)。 索引快取:計算結果儲存在本地(save_metapath_full_cache)以避免重複計算。 3. 特徵投影和節點嵌入初始化 特徵投影: 透過type_tr
您是一位頂尖學術會議(CVPR/ICRA)的專業科學繪圖師。請創建一張清晰、高解析度的「資料處理流程圖」,以說明具身智慧...