Función de recompensa parametrizada R(s, a, s'; θ) -> Ent... | SciDraw AI Gallery