Enables batch DDPG agents to be trained. #416

prabhatnagarajan · 2019-03-22T13:46:51Z

No description provided.

prabhatnagarajan · 2019-03-27T12:51:50Z

This PR changes two Q-functions: FCBNLateActionSAQFunction and FCLateActionSAQFunction. A simple search in the ChainerRL repository:

https://github.com/chainer/chainerrl/search?q=FCBNLateActionSAQFunction&unscoped_q=FCBNLateActionSAQFunction

https://github.com/chainer/chainerrl/search?q=FCLateActionSAQFunction&unscoped_q=FCLateActionSAQFunction

shows that the DDPG example is the only place these are used. Furthermore, looking at the __init__ functions for those networks, it appears that neither of them need recurrence. Since

chainerrl/chainerrl/links/mlp.py

Line 16 in 15d7cbb

class MLP(chainer.Chain):

and

chainerrl/chainerrl/links/mlp_bn.py

Line 31 in 15d7cbb

class MLPBN(chainer.Chain):

are not recurrent.

prabhatnagarajan · 2019-03-29T06:07:22Z

chainerrl/agents/ddpg.py

muupan

👍

prabhatnagarajan added 5 commits March 22, 2019 08:44

adds features, example, and tests for batch training of a DDPG agent

9390235

addresses flakes, cleans some comments

d38cd91

applies autopep8

8ca0a65

makes DDPG follow batch-style

9801f28

fixes multi-env bug

15d7cbb

prabhatnagarajan changed the title ~~[WIP] Enables batch DDPG agents to be trained.~~ Enables batch DDPG agents to be trained. Mar 26, 2019

fixes flake

305b6ba

prabhatnagarajan requested a review from muupan April 6, 2019 12:12

muupan requested changes Apr 12, 2019

View reviewed changes

chainerrl/agents/ddpg.py Outdated Show resolved Hide resolved

chainerrl/agents/ddpg.py Outdated Show resolved Hide resolved

resolves redundant code bug in batch DDPG

27ffbad

prabhatnagarajan requested a review from muupan April 12, 2019 14:46

muupan approved these changes Apr 12, 2019

View reviewed changes

muupan merged commit b8c72c9 into chainer:master Apr 12, 2019

prabhatnagarajan deleted the batch_ddpg branch May 28, 2019 14:53

muupan added this to the v0.7 milestone Jun 28, 2019

muupan added enhancement example labels Jun 28, 2019

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Enables batch DDPG agents to be trained. #416

Enables batch DDPG agents to be trained. #416

Uh oh!

prabhatnagarajan commented Mar 22, 2019

Uh oh!

prabhatnagarajan commented Mar 27, 2019

Uh oh!

prabhatnagarajan commented Mar 29, 2019

Uh oh!

Uh oh!

Uh oh!

muupan left a comment

Uh oh!

Uh oh!

Enables batch DDPG agents to be trained. #416

Enables batch DDPG agents to be trained. #416

Uh oh!

Conversation

prabhatnagarajan commented Mar 22, 2019

Uh oh!

prabhatnagarajan commented Mar 27, 2019

Uh oh!

prabhatnagarajan commented Mar 29, 2019

Uh oh!

Uh oh!

Uh oh!

muupan left a comment

Choose a reason for hiding this comment

Uh oh!

Uh oh!