欢迎光临
我们一直在努力

人工智能和大数据

第7页

怎样为MoE模型配置高效的分布式路由和推理加速?

andy阅读(38)评论(0)

如何高效实现 MoE 模型的分布式路由与推理加速 在大型语言模型向万亿参数演进的过程中,混合专家模型(Mixture-of-Experts, MoE)已成为核心架构。然而,MoE 的稀疏激活特性虽然降低了理论计算量,却给基础设施带来了巨大的...

如何利用强化学习优化AI工作负载的资源调度?

andy阅读(44)评论(0)

如何利用强化学习优化 AI 训练集群的任务调度效率 在现代 AI 基础设施中,如何高效分配 GPU 资源是核心挑战。传统的调度算法如 FIFO(先来先服务)或 DRF(主导资源公平调度)往往难以应对大模型(LLM)训练中复杂的显存碎片化和波...