大佬您好,我注意到推理代码中,时间步会在[0.9877, 0.9338, 0.8529, 0.6090, 0.0000]*1000中进行截取,但在DMD损失项训练时,有一个学生“backward_simulation”的过程,将一个纯噪声数据变成原始数据,这个过程中时间步的选取却是随机的,代码参考如下
for _ in range(n_steps - 1):
G_time_B_1 = torch.minimum(self.draw_training_time_D(x_B_C_T_H_W_size, condition), G_time_B_1)
G_time_B_1 = self.sync(G_time_B_1)
t_traj.append(G_time_B_1)
t_traj.append(0 * G_time_B_1)
为什么不在[0.9877, 0.9338, 0.8529, 0.6090, 0.0000]*1000中随机截取前几个呢?让学生专注于在这几个时间步的能力。想知道大佬您的考量,万分感谢!
大佬您好,我注意到推理代码中,时间步会在[0.9877, 0.9338, 0.8529, 0.6090, 0.0000]*1000中进行截取,但在DMD损失项训练时,有一个学生“backward_simulation”的过程,将一个纯噪声数据变成原始数据,这个过程中时间步的选取却是随机的,代码参考如下
for _ in range(n_steps - 1):
G_time_B_1 = torch.minimum(self.draw_training_time_D(x_B_C_T_H_W_size, condition), G_time_B_1)
G_time_B_1 = self.sync(G_time_B_1)
t_traj.append(G_time_B_1)
t_traj.append(0 * G_time_B_1)
为什么不在[0.9877, 0.9338, 0.8529, 0.6090, 0.0000]*1000中随机截取前几个呢?让学生专注于在这几个时间步的能力。想知道大佬您的考量,万分感谢!