"如图6.18 中,如果隐藏层有一半不工作,那么网络输出值就会比原来的值要小,因为计算WX+b 时,如果W 矩阵中,有一部分的值变成0,那么最后的计算结果肯定会变小。",这句话里说最后的计算结果肯定会变小是不是错了,因为不工作的W不一定都大于0,X也不一定都是正数,也就是说少了的WX不一定都是正数,从而导致最终的计算结果不一定会变小(一般情况会发生改变)?
"如图6.18 中,如果隐藏层有一半不工作,那么网络输出值就会比原来的值要小,因为计算WX+b 时,如果W 矩阵中,有一部分的值变成0,那么最后的计算结果肯定会变小。",这句话里说最后的计算结果肯定会变小是不是错了,因为不工作的W不一定都大于0,X也不一定都是正数,也就是说少了的WX不一定都是正数,从而导致最终的计算结果不一定会变小(一般情况会发生改变)?