Carla模拟环境实验

2018/02/05 - 2018/02/11
工作目标：

- 深入理解ICM论文及[代码](https://pathak22.github.io/noreward-rl/)；

- 进一步熟悉DFP论文及[代码](https://flyyufelix.github.io/2017/11/17/direct-future-prediction.html)；

- Ubuntu远程桌面，服务器上配置调试, try VNC，方便假期远程连接服务器查看图形界面;

- 由于DFP为监督学习，需要收集训练数据，推后实现。先实现ICM 并与Carla对接，无监督训练。
   可参考 https://github.com/SRTjiawei/pytorch-noreward-rl；
   * 第一版只考虑一个动作steer ？
   * 是否必须要使用A3C ？