怎样通过字节码分析 dis 模块洞察 Python 语句的执行效率

Table of Contents

什么是 Python 字节码和 dis 模块？

在 Python 中，我们编写的源代码并不会直接被机器执行。相反，Python 解释器（CPython）首先将源代码编译成一种低级、平台无关的指令集，称为字节码（Bytecode）。然后，Python 虚拟机（PVM）负责逐条执行这些字节码指令。

****dis** 模块**是 Python 标准库中的一个强大工具，它允许我们反汇编（Disassemble）Python 字节码。通过观察一个函数或代码块产生的字节码指令数量和类型，我们可以直观地理解 PVM 在幕后做了哪些工作，从而为我们优化代码执行效率提供关键的洞察。

实操：对比列表创建的两种方法

我们将比较两种常见的创建列表的方法：使用传统的 for 循环结合 append() 方法，以及使用更具 Pythonic 特色的列表推导式（List Comprehension）。我们都知道列表推导式通常更快，但字节码分析可以告诉我们为什么。

1. 定义测试函数

import dis

def create_list_append(n):
    """使用 for 循环和 list.append()"""
    result = []
    for i in range(n):
        result.append(i * 2)
    return result

def create_list_comprehension(n):
    """使用列表推导式"""
    return [i * 2 for i in range(n)]

# 运行 timeit 验证效率差异（可选）
# import timeit
# print(timeit.timeit('create_list_append(1000)', globals=globals(), number=10000))
# print(timeit.timeit('create_list_comprehension(1000)', globals=globals(), number=10000))

2. 分析 create_list_append 的字节码

我们首先分析使用 append 的函数：

dis.dis(create_list_append)

输出示例 (Python 3.10+):

  2           0 BUILD_LIST               0
              2 STORE_FAST               1 (result)

  3           4 LOAD_GLOBAL              0 (range)
              6 LOAD_FAST                0 (n)
              8 CALL_FUNCTION            1
             10 GET_ITER
        >>   12 FOR_ITER                30 (to 44)
             14 STORE_FAST               2 (i)

  4          16 LOAD_FAST                1 (result)
             18 LOAD_METHOD              1 (append)
             20 LOAD_FAST                2 (i)
             22 LOAD_CONST               1 (2)
             24 BINARY_OP                4 (*)
             28 CALL_METHOD              1
             30 POP_TOP
             32 JUMP_ABSOLUTE           12

  5     >>   34 LOAD_FAST                1 (result)
             36 RETURN_VALUE

关键观察点：

在循环体内部（第 4 行对应的字节码），每次迭代都需要执行一系列操作：
1. LOAD_FAST 1 (result): 加载列表对象。
2. LOAD_METHOD 1 (append): 查找并加载列表对象的 append 方法。
3. CALL_METHOD 1: 调用 append 方法。

每次迭代都涉及方法查找和函数调用（即便它是内置方法），这会带来显著的开销。

3. 分析 create_list_comprehension 的字节码

现在，我们分析列表推导式：

dis.dis(create_list_comprehension)

输出示例 (Python 3.10+):

  7           0 LOAD_GLOBAL              0 (range)
              2 LOAD_FAST                0 (n)
              4 CALL_FUNCTION            1
              6 GET_ITER
              8 BUILD_LIST               0
        >>   10 FOR_ITER                20 (to 32)
             12 STORE_FAST               1 (i)
             14 LOAD_FAST                1 (i)
             16 LOAD_CONST               1 (2)
             18 BINARY_OP                4 (*)
             22 LIST_APPEND              2
             24 JUMP_ABSOLUTE           10

  7     >>   26 RETURN_VALUE

关键观察点：

在循环体内部，我们看到一个关键指令：

LIST_APPEND 2: 这是一个高度优化的指令。它直接在 C 级别操作列表内存，无需像 create_list_append 那样执行 LOAD_METHOD 和 CALL_METHOD 来查找并调用 append 函数。

总结

通过字节码分析，我们清晰地看到：

**使用 **append()**** 涉及到重复的面向对象开销（查找方法、调用方法）。
使用列表推导式 则利用了 PVM 提供的底层、优化的指令（LIST_APPEND），避免了这些高层开销，因此执行速度更快。

对于追求极致效率的 Python 代码，dis 模块是理解性能瓶颈、指导优化方向的不可或缺的工具。在比较不同实现路径时，不仅要看执行时间，更要洞察它们是如何被 PVM 编译和执行的。

怎样通过字节码分析 dis 模块洞察 Python 语句的执行效率

什么是 Python 字节码和 dis 模块？

实操：对比列表创建的两种方法

1. 定义测试函数

2. 分析 create_list_append 的字节码

3. 分析 create_list_comprehension 的字节码

总结

相关

相关推荐

评论抢沙发

什么是 Python 字节码和 dis 模块？

实操：对比列表创建的两种方法

1. 定义测试函数

2. 分析 create_list_append 的字节码

3. 分析 create_list_comprehension 的字节码

总结

相关

相关推荐

评论 抢沙发

评论抢沙发