欢迎光临
我们一直在努力

人工智能和大数据

第72页

如何查看ubuntu上占用内存最多的进程

andy阅读(420)评论(0)

在AI模型训练和部署环境中,内存(RAM)和显存(VRAM)的管理是性能优化和稳定性保障的关键。当系统出现性能下降、交换空间(Swap)使用过多,或者直接触发OOM(Out of Memory)错误时,首要任务是找到并分析占用系统内存最多的...

ubuntu如何查看当前系统配置的swap空间大小

andy阅读(399)评论(0)

在AI模型部署和训练的场景中,高效的内存管理至关重要。大型语言模型(LLMs)或复杂的计算机视觉模型往往需要巨大的内存资源。即使拥有大内存的服务器,正确配置和监控Swap空间也能有效防止系统在内存瞬间高峰时崩溃(OOM Kill),尤其是在...

怎样利用JupyterHub实现多租户AI开发环境的安全隔离?

andy阅读(448)评论(0)

在AI模型开发和部署过程中,为团队提供一个共享但隔离的环境是基础设施工程师面临的核心挑战。JupyterHub是理想的解决方案,但要实现多租户的安全隔离和资源公平分配,必须依赖强大的容器编排工具——Kubernetes (K8s)。本文将深...

怎么解决bash: hf: command not found

andy阅读(886)评论(0)

在AI模型部署和基础设施管理中,Hugging Face Hub是我们日常工作的核心平台。Hugging Face提供了一个强大的命令行工具(CLI)用于管理模型、数据集和认证,其主程序名为huggingface-cli。然而,许多用户在使...

vllm docker如何使用cpu启动

andy阅读(637)评论(0)

vLLM因其出色的GPU吞吐量而闻名,但在某些场景下(如本地开发、功能测试或资源受限的环境),用户可能需要在纯CPU上运行vLLM服务。虽然性能远不如GPU,但通过正确的配置,我们依然可以利用vLLM的简洁API和高效加载机制在CPU上启动...

怎样利用GitOps实现模型部署的CI/CD?

andy阅读(388)评论(0)

简介:为什么模型部署需要GitOps? 传统的模型部署流程通常涉及脚本执行和手动干预,这在面对模型快速迭代和严格的合规性要求时,会变得不可持续。 GitOps是一种基于Git的持续交付(Continuous Delivery)实践,它将Gi...