“状态-风险-决策-反馈环”: 输入:综合健康状态、剩余使用寿命、风险评估 决策者:风险约束强化学习 + 因果... | SciDraw Gallery