欢迎光临
我们一直在努力

人工智能和大数据

第2页

如何利用AI编译器TVM实现异构硬件上的模型部署?

andy阅读(42)评论(0)

如何利用 TVM 编译器实现异构硬件上的模型部署与性能调优 在 AI 基础设施领域,将训练好的模型高效部署到多样化的硬件(如 CPU、GPU、DSP、NPU)是核心挑战。Apache TVM 作为一个开源的端到端深度学习编译器,通过其多层 ...

怎样用Istio为AI微服务设置安全策略和流量限制?

andy阅读(36)评论(0)

背景 在生产环境下部署 AI 模型(如大语言模型或图像识别服务)时,AI 基础设施面临两个核心挑战:首先是安全性,推理接口往往涉及敏感数据和核心资产,必须确保通信加密和身份校验;其次是可用性,由于 GPU 资源昂贵且推理过程耗时较长,突发流...

从数据输入到模型部署无需人工干预?

andy阅读(44)评论(0)

在传统的 AI 开发流程中,从数据采集、清洗、模型训练到最终部署,往往涉及多个手动环节。这种‘人工干预’不仅效率低下,且容易因环境不一致导致线上线下表现脱节。本文将介绍如何结合 DVC(Data Version Control)与 GitH...

怎样实现DVC与MLFlow的协同工作流进行实验管理?

andy阅读(41)评论(0)

如何通过 DVC 与 MLFlow 协同构建端到端的模型实验管理工作流 在 AI 基础设施建设中,模型开发的一大核心痛点是“实验一致性”。虽然 MLFlow 能够完美地记录超参数和评估指标,但它在处理 TB 级别的原始数据版本时显得力不从心...

怎样将AI Infra的成本优化结果转化为商业价值报告?

andy阅读(46)评论(0)

如何将AI基础设施成本优化结果转化为商业价值报告 在AI基础设施(AI Infra)领域,工程师往往沉浸于提升GPU利用率、优化算子吞吐量或降低推理延迟。然而,对于管理层和财务决策者来说,单纯的技术指标(如TFLOPS或P99 Latenc...