标签：tensor

从张量核心 Tensor Core 说起：低精度运算是如何在不牺牲精度下提速的

2026-01-30andy阅读(145)评论(0)

在深度学习领域，模型规模不断增大，对计算速度的要求也水涨船高。传统的FP32（单精度浮点数）运算虽然精度高，但计算量大、能耗高。为了解决这一问题，NVIDIA引入了专用的硬件加速单元——Tensor Core，并结合软件层面的混合精度（Mi...

2025-12-28andy阅读(381)评论(0)

在PyTorch的深度学习训练中，管理和清零梯度（Gradient）是一个基础且关键的步骤。然而，很多初学者在尝试手动清零某个特定张量（Tensor）的梯度时，会遇到一个令人困惑的错误：AttributeError: ‘Tens...