标签：function

如何利用 tf.function 的 jit_compile 属性开启局部 XLA 加速以压榨硬件性能

2026-02-10andy阅读(58)评论(0)

在高性能计算领域，特别是深度学习推理和训练中，最大限度地利用硬件（如GPU或TPU）的计算能力至关重要。TensorFlow通过集成XLA（Accelerated Linear Algebra，加速线性代数）编译器来实现这一目标。然而，全局...

2026-02-04andy阅读(91)评论(0)

在TensorFlow 2.x中，tf.function是实现高性能图执行的核心工具。它将普通的Python函数编译成高效、可移植的TensorFlow计算图。然而，要真正发挥其性能，我们必须理解其背后的机制：函数单态化（Monomorph...

2026-02-03andy阅读(84)评论(0)

在TensorFlow 2.x时代，Eager Execution（即时执行）模式极大地提升了开发体验，使得调试像写普通Python代码一样方便。然而，纯粹的Eager模式由于需要反复穿越Python解释器边界，在性能上不如静态计算图。Te...

2026-01-27andy阅读(115)评论(0)

PyTorch之所以强大且灵活，很大程度上归功于其动态计算图（Dynamic Computational Graph, DCG）和自动微分系统（Autograd）。与TensorFlow 1.x的静态图不同，PyTorch的计算图是根据代码...