torch.cuda.comm.reduce_add¶ torch.cuda.comm.reduce_add(inputs, destination=None)[source][source]¶ 从多个 GPU 中求和张量。 所有输入应具有匹配的形状、数据类型和布局。输出张量将具有相同的形状、数据类型和布局。 参数: 输入(可迭代[Tensor])- 要相加的张量序列。 目标(int,可选)- 输出将被放置的设备(默认:当前设备)。 返回值: 包含所有输入逐元素求和的张量,放置在 destination 设备上。