标签：详解

第3页

昇腾显存管理黑盒详解：为什么在 NPU 上频繁创建张量会引发严重的内存碎片

2026-02-24andy阅读(60)评论(0)

如何解决昇腾 NPU 上频繁创建张量导致的内存碎片问题在将模型从 CUDA 迁移到昇腾 NPU（Ascend）时，很多开发者会遇到一个诡异现象：通过 nvidia-smi 类似的工具观察，显存（HBM）占用并没满，但程序却频繁报出 Out...

2026-02-24andy阅读(33)评论(0)

如何解决 Go 语言中接口 nil 判定的陷阱在 Go 语言开发中，判定一个变量是否为 nil 是最基础的操作。然而，在处理接口（interface）类型时，很多开发者会遇到一个极其隐蔽的坑：一个存储了 nil 指针的接口变量，在进行 *...

2026-02-23andy阅读(34)评论(0)

如何通过 AclLite 封装大幅简化昇腾推理程序的开发流程在国产昇腾（Ascend）芯片上进行 AI 推理开发时，开发者通常需要直接面对 CANN (Compute Architecture for Neural Networks) 的...

2026-02-23andy阅读(37)评论(0)

如何理解 Map 的哈希碰撞与扩容在高性能编程中，Map（哈希表）是处理键值对的首选工具。然而，随着存储数据的增长，Map 如何处理键冲突以及如何平滑扩容是决定系统稳定性的关键。本文将深入解析哈希碰撞的成因及现代扩容技术的演进。 1. 哈...

2026-02-23andy阅读(36)评论(0)

如何理解 Go 1.18 之后切片的扩容机制在 Go 语言中，切片（Slice）是使用最频繁的数据结构之一。当切片容量不足时，调用 append 函数会触发底层数组的扩容。Go 1.18 版本对扩容算法进行了重构，放弃了以往简单的 102...

2026-02-22andy阅读(42)评论(0)

背景随着《个人信息保护法》等法规的完善，开发者在处理用户数据（如人脸、语音、健康数据）时面临巨大的合规压力。传统的云端训练需要将原始数据上传服务器，这存在严重隐私风险。端侧训练（On-device Learning）技术通过在用户手机本地...

2026-02-22andy阅读(41)评论(0)

在高性能后端开发中，垃圾回收（GC）的停顿时间（STW）往往是系统响应抖动的元凶。Go 语言通过不断演进，在 1.8 版本引入了混合写屏障（Hybrid Write Barrier），极大地缩短了 STW 耗时。本文将带你透视这一机制的核心...

2026-02-18andy阅读(65)评论(0)

Go语言以其高效的并发能力闻名，但其高性能的基础之一是极其高效的内存分配器。Go的内存分配器基于Google的TCMalloc（Thread-Caching Malloc）思想，采用了精妙的三级缓存结构，极大地减少了分配过程中的锁竞争压力。...

2026-02-17andy阅读(51)评论(0)

怎么解决移动端AI推理时间不稳定问题：详解CPU降频机制与应对策略在移动端部署AI模型时，开发者经常会发现一个令人困扰的现象：模型的推理延迟（Latency）极不稳定。第一次运行可能非常快，但连续运行几次后，延迟会显著增加，甚至在两次间隔...

2026-02-17andy阅读(61)评论(0)

深度学习模型在手机或嵌入式设备上运行时，性能优化不仅仅是为了追求速度，更关键的是控制功耗和散热。高计算负载会导致设备温度急剧上升，一旦达到系统设定的阈值，操作系统会强制降低CPU/GPU的工作频率（即热降频或Thermal Throttli...