标签：一道

一道思考题：在移动端 NPU 上，为什么 3×3 卷积有时跑得比 1×1 卷积还快？

2026-02-10andy阅读(198)评论(0)

在深度学习模型优化，尤其是移动端（如高通Adreno NPU、华为Ascend NPU等）部署时，我们通常认为1×1卷积（点卷积）由于其极少的浮点运算量（FLOPs）理应比3×3卷积快得多。然而，在实际的NPU性能测试中...

2026-02-08andy阅读(277)评论(0)

训练大型语言模型（LLM）是计算密集型任务，其成本往往以GPU-Hours（GPU小时数）来衡量。准确估算这一指标，是项目规划和预算控制的关键。本文将基于LLM训练的算力基础公式（Chinchilla Scaling Laws），提供一个实...

2026-02-08andy阅读(149)评论(0)

智能座舱作为车辆的大脑，其安全性至关重要。任何未授权的代码（如恶意固件、被篡改的操作系统内核）都可能导致车辆功能受损甚至威胁驾驶安全。安全启动（Secure Boot）机制正是解决这一问题的核心手段，它确保了从设备上电开始，只有经过数字签名...