标签：函数

详解 Go 汇编代码分析：如何看懂 Plan 9 汇编以优化极速计算函数

2026-02-27andy阅读(110)评论(0)

如何通过分析 Plan 9 汇编优化 Go 语言的高性能计算函数在 Go 语言开发中，绝大多数场景下我们不需要关注底层汇编。但在编写高性能科学计算、加解密算法或底层驱动时，理解 Go 的 Plan 9 汇编能帮助我们洞察编译器的行为，消除...

2026-02-16andy阅读(90)评论(0)

Warp Divergence（线程束分化）是CUDA编程中一个极其重要的概念，它直接关系到核函数（Kernel）的执行效率。对于追求极致性能的高性能算子来说，理解并消除Warp Divergence是提升速度的关键。 1. 什么是Warp...

2026-02-14andy阅读(130)评论(0)

Java 平台自 Java 19（作为孵化模块）以来引入的外部函数与内存 API（Foreign Function and Memory API，简称 FFM API，JEP 442 已在 Java 22 中定稿）彻底改变了 Java 与原...

2026-02-13andy阅读(104)评论(0)

在AI模型的推理加速领域，显存带宽往往是性能瓶颈的关键。模型计算图中的许多操作，如卷积（Conv）和随后的激活函数（ReLU），虽然逻辑上是独立的步骤，但在执行时，需要将中间结果从计算单元（如GPU或NPU）写入显存，再由下一个操作读取。这...

2026-02-06andy阅读(207)评论(0)

在 Python 编程中，效率和内存优化是提升应用性能的关键。itertools 和 functools 是 Python 标准库中两个强大的模块，它们提供了一系列高阶函数和工具，能够将原本需要复杂循环或大量内存消耗的操作，转化为高效、简洁...

2026-02-04andy阅读(139)评论(0)

在TensorFlow 2.x中，tf.function是实现高性能图执行的核心工具。它将普通的Python函数编译成高效、可移植的TensorFlow计算图。然而，要真正发挥其性能，我们必须理解其背后的机制：函数单态化（Monomorph...

2026-02-04andy阅读(200)评论(0)

在构建复杂的 Python 框架、Web 框架或依赖注入（DI）系统时，我们经常需要动态地知道一个函数需要哪些参数，并根据这些需求从一个可用的资源池中自动提供相应的参数。Python 标准库中的 inspect 模块正是解决这类问题的利器。...

2026-02-03andy阅读(193)评论(0)

作为Python的高级特性之一，装饰器（Decorator）不仅可以用来修改或增强函数的行为，更强大的功能在于通过使用类来实现装饰器，从而实现状态的保持（Stateful Closure）和类方法的属性拦截（Attribute Interc...