标签：功耗

如何针对不同的移动端架构（A76 vs A55）配置推理库的并行线程数以平衡功耗与性能

2026-03-05andy阅读(50)评论(0)

在移动端部署深度学习模型时，开发者常面临一个困境：简单的设置线程数为核心总数往往会导致严重的发热降频，而线程数太少又无法满足实时性需求。本文将深入解析如何在 ARM big.LITTLE 架构（如典型的 A76+A55 组合）下，通过合理的...

2026-02-28andy阅读(80)评论(0)

如何通过系统底层指令精准监控国产AI芯片的算力能效比在智算中心和国产化替代的趋势下，针对国产AI芯片（如华为昇腾、寒武纪、元枢等）的精细化监控变得至关重要。本文将以昇腾（Ascend）系列芯片为例，重点讲解如何通过底层指令获取实时功耗与算...

2026-02-17andy阅读(98)评论(0)

深度学习模型在手机或嵌入式设备上运行时，性能优化不仅仅是为了追求速度，更关键的是控制功耗和散热。高计算负载会导致设备温度急剧上升，一旦达到系统设定的阈值，操作系统会强制降低CPU/GPU的工作频率（即热降频或Thermal Throttli...

2026-02-15andy阅读(72)评论(0)

在资源受限的端侧设备（如手机、IoT设备）上部署深度学习模型时，模型量化（通常是转换为INT8）是降低延迟和功耗的关键技术。然而，量化方案并非只有一种。本文将对比静态离线量化（Static Post-Training Quantizatio...

2026-02-11andy阅读(117)评论(0)

AI 集群的功耗挑战与 DVFS 简介随着AI模型规模的爆炸式增长，支持这些模型的计算集群（无论是使用高性能CPU还是GPU）消耗的能源也水涨船高。高功耗不仅意味着高昂的电费，还会带来巨大的散热压力和潜在的硬件故障风险。在许多情况下，集群...