7327bc3aa7a0e66168a84380edbd1e74a5a16355,ch04/04_frozenlake_nonslippery.py,,,#,93

Before Change


        loss_v.backward()
        optimizer.step()
        print("%d: loss=%.3f, reward_mean=%.3f, reward_bound=%.3f, batch=%d" % (
            iter_no, loss_v.data[0], reward_mean, reward_bound, len(full_batch)))
        writer.add_scalar("loss", loss_v.data[0], iter_no)
        writer.add_scalar("reward_mean", reward_mean, iter_no)
        writer.add_scalar("reward_bound", reward_bound, iter_no)

After Change


        if not full_batch:
            continue
        obs_v = torch.FloatTensor(obs)
        acts_v = torch.LongTensor(acts)
        full_batch = full_batch[-500:]

        optimizer.zero_grad()
        action_scores_v = net(obs_v)

In pattern: SUPERPATTERN

Frequency: 3

Non-data size: 3

Instances

Link

Project Name: PacktPublishing/Deep-Reinforcement-Learning-Hands-On

Commit Name: 7327bc3aa7a0e66168a84380edbd1e74a5a16355

Time: 2018-04-25

Author: max.lapan@gmail.com

File Name: ch04/04_frozenlake_nonslippery.py

Class Name:

Method Name:

Link

Project Name: hunkim/PyTorchZeroToAll

Commit Name: 47bb7e1f4f7950a37f72aafa99accddbd4fea9eb

Time: 2020-06-13

Author: adithyatp@yahoo.com

File Name: 12_2_hello_rnn.py

Class Name:

Method Name:

Link

Project Name: PacktPublishing/Deep-Reinforcement-Learning-Hands-On

Commit Name: 7327bc3aa7a0e66168a84380edbd1e74a5a16355

Time: 2018-04-25

Author: max.lapan@gmail.com

File Name: ch04/03_frozenlake_tweaked.py

Class Name:

Method Name: