欢迎光临
我们一直在努力

标签:vllm

免费AI课程

vllm及sglang教程

andy阅读(10)评论(0)

零成本上手大模型推理:vLLM与SGLang高性能框架免费实战教程 作为一名自学AI的技术博主,我最近深入研究了大模型的后端推理优化。如果你发现自己的GPU显存利用率低,或者并发请求时响应太慢,那么这套关于 vLLM 和 SGLang 的免...

人工智能和大数据

vllm docker如何使用cpu启动

andy阅读(391)评论(0)

vLLM因其出色的GPU吞吐量而闻名,但在某些场景下(如本地开发、功能测试或资源受限的环境),用户可能需要在纯CPU上运行vLLM服务。虽然性能远不如GPU,但通过正确的配置,我们依然可以利用vLLM的简洁API和高效加载机制在CPU上启动...