标签：内存

第2页

怎样正确使用 context.Value 传递链路信息并规避潜在的隐式内存泄漏

2026-02-27andy阅读(58)评论(0)

如何在 Go 中正确使用 context.Value 传递链路信息并规避内存泄漏在 Go 微服务开发中，context.Value 是在函数间传递 Request ID、UserID 或 Trace 信息的最常用工具。然而，由于 cont...

2026-02-25andy阅读(60)评论(0)

如何通过内存对齐 Padding 提升 Go 结构体在 CPU 缓存行中的访问性能在现代多核 CPU 架构中，内存访问的最小单位并非单个字节，而是被称为缓存行（Cache Line）的数据块，通常为 64 字节。当多个线程（或 Gorou...

2026-02-24andy阅读(98)评论(0)

如何解决昇腾 NPU 上频繁创建张量导致的内存碎片问题在将模型从 CUDA 迁移到昇腾 NPU（Ascend）时，很多开发者会遇到一个诡异现象：通过 nvidia-smi 类似的工具观察，显存（HBM）占用并没满，但程序却频繁报出 Out...

2026-02-22andy阅读(78)评论(0)

如何通过 runtime.SetFinalizer 捕捉 Go 对象的生命周期终点与内存泄漏在 Go 语言的开发过程中，内存管理主要由垃圾回收器（GC）自动化处理。然而，在处理系统资源（如文件描述符、网络连接）或排查复杂的内存泄漏时，了解...

2026-02-18andy阅读(93)评论(0)

Go语言以其高效的并发能力闻名，但其高性能的基础之一是极其高效的内存分配器。Go的内存分配器基于Google的TCMalloc（Thread-Caching Malloc）思想，采用了精妙的三级缓存结构，极大地减少了分配过程中的锁竞争压力。...

2026-02-16andy阅读(74)评论(0)

在高性能计算（HPC）领域，理解何时工作负载受限于计算能力（Compute Bound）或内存带宽（Memory Bound）至关重要。这通常通过“屋顶线模型”（Roofline Model）来分析。对于矩阵乘法（GEMM）任务，我们希望...

2026-02-15andy阅读(71)评论(0)

在移动端进行AI推理时，显存（通常是共享内存DRAM或专用的VRAM）往往是瓶颈。对于参数量较大的模型（如轻量级LLM或大型CV模型），其激活值和中间计算结果可能会瞬间占用数百兆甚至超过1GB的内存。本文将聚焦于推理引擎中最关键的优化技术之...

2026-02-15andy阅读(103)评论(0)

vLLM（Virtual Large Language Model）框架凭借其创新的内存管理技术 PagedAttention，极大地提升了LLM推理的吞吐量和效率。PagedAttention借鉴了传统操作系统中的虚拟内存和分页思想，核心...

2026-02-14andy阅读(86)评论(0)

为什么 VRAM 成为大模型训练的瓶颈？在训练参数量巨大的模型（如 Llama-2 70B）时，即使是顶级的GPU（如A100或H100）也面临着显存（VRAM）不足的问题。一个完整的模型训练状态需要存储以下核心组件：模型参数 (P)：...

2026-02-14andy阅读(81)评论(0)

Java 平台自 Java 19（作为孵化模块）以来引入的外部函数与内存 API（Foreign Function and Memory API，简称 FFM API，JEP 442 已在 Java 22 中定稿）彻底改变了 Java 与原...