Parametrisierte Belohnungsfunktion R(s, a, s'; θ) -> RL T... | SciDraw AI Gallery