标签：核心

如何通过模型分片技术将大型视觉模型跨核心部署在智能座舱的不同算力单元上

2026-03-20andy阅读(64)评论(0)

如何通过模型分片技术将大型视觉模型跨核心部署在智能座舱异构单元在智能座舱场景下，SoC芯片（如高通8295、华为麒麟系列）通常集成有多个异构算力单元（NPU、GPU、DSP）。当单颗NPU无法承载大参数量模型或需要降低单核功耗时，模型分片...

2026-01-31andy阅读(125)评论(0)

在智能座舱（Smart Cockpit）系统中，视觉模型（如高分辨率感知、驾驶员/乘客监控DMS/OMS模型）往往体积庞大且计算密集。单个算力单元（如特定的NPU或DSP）可能无法提供足够的内存或吞吐量。模型分片（Model Shardin...

2026-01-30andy阅读(133)评论(0)

在深度学习领域，模型规模不断增大，对计算速度的要求也水涨船高。传统的FP32（单精度浮点数）运算虽然精度高，但计算量大、能耗高。为了解决这一问题，NVIDIA引入了专用的硬件加速单元——Tensor Core，并结合软件层面的混合精度（Mi...

2026-01-29andy阅读(142)评论(0)

Kubernetes（K8s）是目前最流行的容器编排系统，但它的专业术语常常让人望而生畏。其实，K8s 就像一家高效运转的自动化工厂。要理解它，我们只需要拆解它的“大脑”和“肌肉”——即控制平面（Control Plane）和工作节点（Wo...