标签：对齐

怎样通过 ncnn 的 Mat 结构理解端侧内存对齐：详解 32 字节对齐对 SIMD 加速的意义

2026-03-01andy阅读(89)评论(0)

如何通过 ncnn 的 Mat 结构理解端侧内存对齐：详解 32 字节对齐对 SIMD 加速的意义在高性能端侧推理框架（如腾讯的 ncnn）中，性能优化往往精确到每一位内存布局。在阅读 ncnn 源码时，你会发现其核心数据结构 ncnn:...

2026-02-25andy阅读(105)评论(0)

如何通过内存对齐 Padding 提升 Go 结构体在 CPU 缓存行中的访问性能在现代多核 CPU 架构中，内存访问的最小单位并非单个字节，而是被称为缓存行（Cache Line）的数据块，通常为 64 字节。当多个线程（或 Gorou...

2026-02-07andy阅读(128)评论(0)

知识蒸馏（Knowledge Distillation, KD）是一种模型压缩技术，通过训练一个轻量级的学生模型去模仿一个性能强大的教师模型（Teacher Model）的输出。在大模型（LLM）时代，KD的焦点已经从单纯的“模仿输出概率”...