
大規模モデルの重みと活性化値の不均一な分布、および量子化ノイズに対する感度に対処するため、まず、二階感度分析と非一様量子化に基づく低ビット圧縮技術を研究する。次に、量子化圧縮に基づき、異なるモジュール(レイヤー/ヘッド/チャネル)のパラメータが最終的な損失関数に与える感度を自動的に評価する方法を調査する。勾配分散または微分導出を分析することにより、ターゲットモデルの混合精度構成戦略を生成し、量子化フレームワーク内で精度と速度の二次的なバランスを実現する。その後、最適化されたモデルの数値的信頼性を確保するために、大規模モデルに適した効率的なエラー検出方法を研究し、混合精度および量子化演算によって導入される数値エラーの伝播モデリングと境界推定を実行し、最適化戦略の精度保証を提供する。最後に、上記の3つの技術を統合した、ソースからソースへの統一された自動コンパイルフレームワークを研究および構築する。このフレームワークは、MLIRなどの中間表現に基づいて、モデル解析、共同最適化戦略探索、エラー分析からターゲットハードウェア用の高性能コード生成まで、完全自動化されたプロセスを実現する。
進化アルゴリズムにおける交叉演算子の図解。7つのタスクからなるアプリケーションを想定し、交叉点は位置3で選択される。実行...