2018/02/05 - 2018/02/11 工作目标: - 深入理解ICM论文及[代码](https://pathak22.github.io/noreward-rl/); - 进一步熟悉DFP论文及[代码](https://flyyufelix.github.io/2017/11/17/direct-future-prediction.html); - Ubuntu远程桌面,服务器上配置调试, try VNC,方便假期远程连接服务器查看图形界面; - 由于DFP为监督学习,需要收集训练数据,推后实现。先实现ICM 并与Carla对接,无监督训练。 可参考 https://github.com/SRTjiawei/pytorch-noreward-rl; * 第一版只考虑一个动作steer ? * 是否必须要使用A3C ?
2018/02/05 - 2018/02/11
工作目标:
深入理解ICM论文及代码;
进一步熟悉DFP论文及代码;
Ubuntu远程桌面,服务器上配置调试, try VNC,方便假期远程连接服务器查看图形界面;
由于DFP为监督学习,需要收集训练数据,推后实现。先实现ICM 并与Carla对接,无监督训练。
可参考 https://github.com/SRTjiawei/pytorch-noreward-rl;