Bidirectional Model-based Policy Optimization

This is the TensorFlow implementation for the paper Bidrectional Model-based Policy Optimization.

Requirements

pip install -r requirements.txt

python main.py --config=config.hopperNT

To change hyper-parameters, please modify the corresponding config file in config/.

This code is mainly modified based on the mbpo codebase.

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
config		config
env		env
models		models
softlearning		softlearning
static		static
utils		utils
LICENSE		LICENSE
README.md		README.md
bmpo.py		bmpo.py
main.py		main.py
requirements.txt		requirements.txt
runner.py		runner.py