欢迎光临
我们一直在努力

人工智能和大数据

第36页

基于角色的权限设计?

andy阅读(196)评论(0)

作为AI基础设施的关键组成部分,模型部署环境(如Kubernetes集群)的安全性至关重要。一个常见的安全漏洞是权限过度授予,使得攻击者或意外操作者能够访问、修改甚至删除敏感的模型配置或生产Pod。基于角色的权限控制(RBAC)是解决这一问...

怎么从 xxxJni.java生成native-lib.c

andy阅读(148)评论(0)

在AI模型部署和高性能计算领域,我们经常需要将Java(例如Android应用或基于JVM的推理服务)的高级逻辑层与底层高度优化的C/C++库(如CUDA内核、ONNX Runtime或自定义加速库)连接起来。Java Native Int...

微调LoRA时,如何防止有毒数据污染基础模型?

andy阅读(100)评论(0)

引言:LoRA微调中的数据安全挑战 参数高效微调(PEFT),尤其是低秩适配(LoRA),已成为部署大型语言模型(LLM)的主流技术。LoRA通过训练少量新增的适配器(Adapter)权重,在保持基础模型(Base Model)权重不变的前...

如何利用vLLM或FasterTransformer加速LLM的低延迟推理部署?

andy阅读(109)评论(0)

引言:为什么传统部署方法无法应对LLM的流量高峰? 大型语言模型(LLM)的部署面临两大核心挑战:低延迟(用户响应时间)和高吞吐量(每秒处理的总请求数)。传统的推理框架,如基于标准的Hugging Face Transformers,在处理...

怎样使用AdvBench或HELM工具量化评估您的LLM安全水平?

andy阅读(106)评论(0)

引言:生产级LLM部署中的安全挑战 在将大型语言模型(LLM)投入生产环境时,模型的性能指标(如准确率、推理速度)固然重要,但模型的安全对齐性(Safety Alignment)往往决定了部署的成败。评估LLM是否会生成有毒内容、是否带有系...