ce96b03b07a4a4bdd851aa84493c616cd291aff2,rllib/examples/env/mbmpo_env.py,HopperWrapper,reward,#HopperWrapper#Any#Any#Any#,39

Before Change


        alive_bonus = 1.0
        assert obs.ndim == 2 and action.ndim == 2
        assert obs.shape == obs_next.shape and action.shape[0] == obs.shape[0]
        vel = obs_next[:, 5]
        ctrl_cost = 1e-3 * np.sum(np.square(action), axis=1)
        reward = vel + alive_bonus - ctrl_cost
        return np.minimum(np.maximum(-1000.0, reward), 1000.0)


if __name__ == "__main__":
    env = HopperWrapper()

After Change


        // obs = [cos(theta), sin(theta), dtheta/dt]
        // To get the angle back from obs: atan2(sin(theta), cos(theta)).
        theta = np.arctan2(
            np.clip(obs[:, 1], -1.0, 1.0), np.clip(obs[:, 0], -1.0, 1.0))
        // Do everything in (B,) space (single theta-, action- and
        // reward values).
        a = np.clip(action, -self.max_torque, self.max_torque)[0]

In pattern: SUPERPATTERN

Frequency: 3

Non-data size: 3

Instances

Link

Project Name: ray-project/ray

Commit Name: ce96b03b07a4a4bdd851aa84493c616cd291aff2

Time: 2020-10-06

Author: sven@anyscale.io

File Name: rllib/examples/env/mbmpo_env.py

Class Name: HopperWrapper

Method Name: reward

Link

Project Name: chainer/chainercv

Commit Name: 2928d279badfbb9154fe210154e8eee370f9bec5

Time: 2018-10-25

Author: yuyuniitani@gmail.com

File Name: chainercv/datasets/cub/cub_point_dataset.py

Class Name: CUBPointDataset

Method Name: _get_img_and_annotations

Link

Project Name: chainer/chainercv

Commit Name: 95019f66fa70766e78a949bddd336305be4918b8

Time: 2017-05-22

Author: yuyuniitani@gmail.com

File Name: chainercv/evaluations/eval_detection_voc.py

Class Name:

Method Name: _pred_and_rec_cls