373ae159f7ae1cabaf87228d1ae0fb6acd1c6363,ch14/lib/common.py,,unpack_batch_a2c,#,8

Before Change


    // handle rewards
    rewards_np = np.array(rewards, dtype=np.float32)
    if not_done_idx:
        last_states_v = ptan.agent.float32_preprocessor(last_states, cuda=cuda)
        last_vals_v = net(last_states_v)[2]
        last_vals_np = last_vals_v.data.cpu().numpy()[:, 0]
        rewards_np[not_done_idx] += last_val_gamma * last_vals_np

After Change


    // handle rewards
    rewards_np = np.array(rewards, dtype=np.float32)
    if not_done_idx:
        last_states_v = ptan.agent.float32_preprocessor(last_states).to(device)
        last_vals_v = net(last_states_v)[2]
        last_vals_np = last_vals_v.data.cpu().numpy()[:, 0]
        rewards_np[not_done_idx] += last_val_gamma * last_vals_np

In pattern: SUPERPATTERN

Frequency: 14

Non-data size: 5

Instances

Link

Project Name: PacktPublishing/Deep-Reinforcement-Learning-Hands-On

Commit Name: 373ae159f7ae1cabaf87228d1ae0fb6acd1c6363

Time: 2018-04-29

Author: max.lapan@gmail.com

File Name: ch14/lib/common.py

Class Name:

Method Name: unpack_batch_a2c

Link

Project Name: PacktPublishing/Deep-Reinforcement-Learning-Hands-On

Commit Name: 373ae159f7ae1cabaf87228d1ae0fb6acd1c6363

Time: 2018-04-29

Author: max.lapan@gmail.com

File Name: ch14/lib/model.py

Class Name: AgentA2C

Method Name: __call__

Link

Project Name: PacktPublishing/Deep-Reinforcement-Learning-Hands-On

Commit Name: d5b0cd8e7960c247bb7c5b7c832358f8831780fb

Time: 2018-04-29

Author: max.lapan@gmail.com

File Name: ch15/05_train_acktr.py

Class Name:

Method Name: test_net

Link

Project Name: PacktPublishing/Deep-Reinforcement-Learning-Hands-On

Commit Name: d5b0cd8e7960c247bb7c5b7c832358f8831780fb

Time: 2018-04-29

Author: max.lapan@gmail.com

File Name: ch15/03_train_trpo.py

Class Name:

Method Name: test_net

Link

Project Name: PacktPublishing/Deep-Reinforcement-Learning-Hands-On

Commit Name: 373ae159f7ae1cabaf87228d1ae0fb6acd1c6363

Time: 2018-04-29

Author: max.lapan@gmail.com

File Name: ch14/02_train_a2c.py

Class Name:

Method Name: test_net

Link

Project Name: PacktPublishing/Deep-Reinforcement-Learning-Hands-On

Commit Name: d5b0cd8e7960c247bb7c5b7c832358f8831780fb

Time: 2018-04-29

Author: max.lapan@gmail.com

File Name: ch15/lib/model.py

Class Name: AgentA2C

Method Name: __call__

Link

Project Name: PacktPublishing/Deep-Reinforcement-Learning-Hands-On

Commit Name: 373ae159f7ae1cabaf87228d1ae0fb6acd1c6363

Time: 2018-04-29

Author: max.lapan@gmail.com

File Name: ch14/lib/model.py

Class Name: AgentDDPG

Method Name: __call__

Link

Project Name: PacktPublishing/Deep-Reinforcement-Learning-Hands-On

Commit Name: 373ae159f7ae1cabaf87228d1ae0fb6acd1c6363

Time: 2018-04-29

Author: max.lapan@gmail.com

File Name: ch14/lib/common.py

Class Name:

Method Name: unpack_batch_ddqn

Link

Project Name: PacktPublishing/Deep-Reinforcement-Learning-Hands-On

Commit Name: d5b0cd8e7960c247bb7c5b7c832358f8831780fb

Time: 2018-04-29

Author: max.lapan@gmail.com

File Name: ch15/lib/common.py

Class Name:

Method Name: unpack_batch_a2c

Link

Project Name: PacktPublishing/Deep-Reinforcement-Learning-Hands-On

Commit Name: d5b0cd8e7960c247bb7c5b7c832358f8831780fb

Time: 2018-04-29

Author: max.lapan@gmail.com

File Name: ch15/01_train_a2c.py

Class Name:

Method Name: test_net

Link

Project Name: PacktPublishing/Deep-Reinforcement-Learning-Hands-On

Commit Name: 373ae159f7ae1cabaf87228d1ae0fb6acd1c6363

Time: 2018-04-29

Author: max.lapan@gmail.com

File Name: ch14/04_train_ddpg.py

Class Name:

Method Name: test_net

Link

Project Name: PacktPublishing/Deep-Reinforcement-Learning-Hands-On

Commit Name: d5b0cd8e7960c247bb7c5b7c832358f8831780fb

Time: 2018-04-29

Author: max.lapan@gmail.com

File Name: ch15/04_train_ppo.py

Class Name:

Method Name: test_net

Link

Project Name: PacktPublishing/Deep-Reinforcement-Learning-Hands-On

Commit Name: 373ae159f7ae1cabaf87228d1ae0fb6acd1c6363

Time: 2018-04-29

Author: max.lapan@gmail.com

File Name: ch14/lib/model.py

Class Name: AgentD4PG

Method Name: __call__

Link

Project Name: PacktPublishing/Deep-Reinforcement-Learning-Hands-On

Commit Name: 373ae159f7ae1cabaf87228d1ae0fb6acd1c6363

Time: 2018-04-29

Author: max.lapan@gmail.com

File Name: ch14/06_train_d4pg.py

Class Name:

Method Name: test_net