人工智能和大数据

第73页

如何利用DVC/Git LFS管理TB级数据和模型，实现版本控制？

2025-11-15andy阅读(312)评论(0)

在现代深度学习项目中，数据集和模型检查点往往达到数百GB甚至TB级。传统的Git系统在处理这些大型文件时会变得极其缓慢甚至崩溃。虽然Git LFS（Large File Storage）提供了一个解决方案，但它在处理复杂的ML实验、目录版本...

2025-11-14andy阅读(278)评论(0)

NVIDIA Triton Inference Server是高性能AI模型部署的核心工具。对于初学者和希望快速验证部署环境的工程师来说，理解并运行官方提供的样例模型是至关重要的第一步。本文将指导您如何获取官方模型仓库，并部署运行最基础的i...

2025-11-14andy阅读(389)评论(0)

在部署大型语言模型（LLM）时，特别是面向公众的服务，内容安全是至关重要的。传统的安全护栏（Guardrail）通常在用户输入端进行检查（Pre-Filter），但这无法应对模型在生成过程中可能出现的幻觉或有害内容（如仇恨言论、恶意指令）。...

2025-11-14andy阅读(329)评论(0)

为什么大模型需要护栏？大语言模型（LLMs）的强大能力在商业应用中带来了革命性的变革，但同时也引入了风险：模型幻觉（hallucination）、安全漏洞、恶意提示注入（prompt injection）以及偏离业务逻辑。在生产环境中部署...

2025-11-14andy阅读(330)评论(0)

在深度学习模型训练中，GPU的计算速度远超CPU的数据准备和I/O速度。如果数据加载跟不上GPU的消费速度，就会出现“GPU饥饿”（GPU Starvation），导致GPU资源闲置，浪费了昂贵的计算时间。本文将深入探讨PyTorch中配置...

2025-11-14andy阅读(368)评论(0)

引言：模型服务中的数据传输瓶颈在高性能AI模型部署的场景中，我们通常将注意力集中在模型本身的推理速度（如使用TensorRT、OpenVINO等优化器）。然而，一个常被忽视的性能杀手是数据输入和输出（I/O）的效率。当处理大批量请求、高维...

2025-11-13andy阅读(452)评论(0)

如何使用 PyRIT 框架进行大模型安全评测的架构解析与实战随着大型语言模型（LLMs）的广泛应用，对其进行严格的安全性和鲁棒性评估变得至关重要。微软开发的 Python Risk Identification Toolkit (PyRI...

2025-11-13andy阅读(309)评论(0)

Elkeid是由字节跳动开源的高性能终端安全响应（EDR）平台。对于希望定制化安全功能、集成私有检测逻辑或优化性能的开发者来说，搭建高效的二次开发环境至关重要。本文将详细指导如何配置开发工具、克隆代码库并成功编译Elkeid的核心组件。 1...

2025-11-13andy阅读(488)评论(0)

导语：从脚本小子到AI驱动的渗透工程师传统的渗透测试（Pentest）高度依赖工程师的经验和手册流程。然而，随着大型语言模型（LLMs）能力的飞速提升，我们正进入LLM-driven Pentest时代。这种新范式要求工具不仅能执行命令，...

2025-11-13andy阅读(289)评论(0)

在现代推荐系统和实时决策系统中，特征工程必须从传统的批处理模式转向低延迟的实时服务。特征提取的延迟是影响整个模型服务（Serving）链路的关键瓶颈。本文将深入探讨如何利用 Ray 强大的分布式计算能力和Actor模型，构建一个能够实现毫秒...