Hybird flow shop scheduling problems
理论上agent与其对应的job在各自链表中的位置是一致的,但这种处理方式缺乏agent异常处理。后续如果有需要应该补齐,
完善多智能体强化学习
今日任务:2025/02/20 状态代码的实现 √ 环境逻辑调通 √
今日任务:2025/02/21 网络和训练代码实现(独立D3QN,网络共享) √ 开始训练 √
今日任务:2025/02/22 尝试增量的奖励设定 √ 尝试增加或替换不同的基础调度规则 × 尝试使用连续动作空间 ×
今日任务:2025/02/23 尝试使用连续动作空间