标签：芯片

第2页

统一内存架构（UMA）：Apple M3 芯片的统一内存对大模型端侧推理的启示

2026-02-10andy阅读(344)评论(0)

随着大模型的体积不断增长，如何在资源受限的端侧设备上高效运行这些模型成为了关键挑战。Apple M系列芯片，特别是最新的M3系列，通过其独特的统一内存架构（Unified Memory Architecture, UMA），为端侧大模型推理...

2026-02-07andy阅读(131)评论(0)

车载信息娱乐系统（IVI）和高级驾驶辅助系统（ADAS）对低延迟AI推理的需求日益增长。传统的云端AI模型部署流程复杂且延迟高，因此轻量级的端侧推理库（如NCNN和MNN）成为车载AI功能快速原型化的理想选择。本文将聚焦于如何利用NCNN，...

2026-02-02andy阅读(190)评论(0)

在汽车电子和智能座舱领域，集成大型语言模型（LLM）以提供自然语言交互的智能管家服务是趋势。然而，车载芯片（如高通SA8155或英伟达Orin等）虽然算力强大，但在内存（RAM/VRAM）方面相对桌面级或服务器级GPU资源有限。一个7B参数...

2026-01-30andy阅读(162)评论(0)

别再神话国产芯片：深度解析算子库生态对国产 GPU 落地限制的底层逻辑近年来，国产GPU在硬件设计上取得了显著进步。然而，当讨论它们在深度学习或高性能计算（HPC）领域的实际应用时，人们往往忽略了一个致命的核心问题：算子库生态。算子库生态...

2026-01-29andy阅读(180)评论(0)

在评估GPU、AI加速卡或高性能计算芯片的性能时，TFLOPS（Tera-Floating Point Operations Per Second，每秒万亿次浮点运算）是一个核心指标。然而，规格书上的TFLOPS数字往往是理论峰值性能，它极...