集群通信原语:一文讲透 All-Reduce, All-Gather 和 Reduce-Scatter 的执行逻辑
在分布式训练,尤其是深度学习模型的分布式训练中,高效的节点间通信是性能的关键。All-Reduce、All-Gather 和 Reduce-Scatter 是最核心的三种集体通信原语(Collective Communication Pri...
在分布式训练,尤其是深度学习模型的分布式训练中,高效的节点间通信是性能的关键。All-Reduce、All-Gather 和 Reduce-Scatter 是最核心的三种集体通信原语(Collective Communication Pri...