
プロセスは、データ入力、グラフ構築、特徴処理、コア計算、出力予測の5つの主要な段階で展開され、異種グラフの特性、メタパスインデックスの構築、およびノードレベルのアテンションメカニズムの重要な役割を強調しています。以下は、詳細なプロセス記述です。 モデル全体のプロセス概要 THANモデルは、異種グラフ(ユーザー、カスケードノード、およびさまざまな関係を含む)に基づいており、メタパスインデックスを通じてノード間の意味的関連性を捉え、時間減衰メカニズムとマルチヘッドアテンションを組み合わせてノード埋め込みを計算し、最終的にはカスケード伝播のシングルステップ予測に使用されます。プロセスは、次の5つの主要な段階に分けることができます。 1. データ入力と初期化 入力データ: 異種グラフデータ(グラフ):ノード(ユーザー、カスケード)、エッジ(ソーシャル、インタラクション、拡散)、およびエッジ属性(タイムスタンプなど)が含まれます。 初期特徴:ユーザー特徴(user_initial_features)とカスケード特徴(cascade_initial_features)は、辞書形式で保存されます(id_to_idxはノードIDを特徴インデックスにマップします)。 構成パラメータ:メタパスタイプ(例:U-U-social、U-U-interact、C-U-C)、アテンションヘッド数、時間減衰係数lambda_timeなど。 初期化操作: デバイス構成(CPU/GPU)とメモリ最適化(キャッシュクリア、非同期データ転送)。 モデルコンポーネントの初期化:特徴投影レイヤー(type_transform)、マルチヘッドアテンションパラメータ(att_params)など。 2. 異種グラフメタパスインデックスの構築 build_metapath_indexメソッドを使用して、メタパスインデックスを事前に計算し、異なるタイプのノード間の関連性と時間減衰特徴を捉え、後続のアテンション計算を高速化します。 メタパスの定義: U-U-social:ユーザー - ソーシャル - ユーザー(タイムスタンプなし、隣接関係のみを保存)。 U-U-interact:ユーザー - インタラクト - ユーザー(インタラクションタイムスタンプ、時間減衰値、およびプレフィックスサムを保存)。 C-U-C:カスケード - ユーザー - カスケード(中間ユーザーを介して接続されたカスケード関係、拡散タイムスタンプ、時間減衰値、およびプレフィックスサムを保存)。 インデックスの内容: 時間情報を含むメタパス(U-U-interact、C-U-C)の場合、ノードペアごとに保存します。 タイムスタンプのソートされたリスト(ts)。 時間減衰値(decay、1 - exp(-lambda*(t-T_earliest))に基づいて計算)。 減衰値のプレフィックスサム(prefix、累積重み計算を高速化)。 インデックスキャッシュ:計算結果は、繰り返し計算を避けるためにローカルに保存されます(save_metapath_full_cache)。 3. 特徴投影とノード埋め込みの初期化 特徴投影: type_tr
あなたはトップレベルの学術会議(CVPR/ICRA)向けのプロの科学イラストレーターです。具体化された知能システムの「エ...