深入解析sys.getsizeof()

发布时间:2023-05-19

Python对象的内存占用分析

Python提供的sys模块中,有一个getsizeof()函数可以返回对象的占用字节数。

一、数据类型的占用字节数

Python支持的内置数据类型,包括intfloatboollisttupledict等等。但是它们各自所占用的字节数是不同的,通过getsizeof()函数可以输出它们的实际占用字节数:

import sys
i = 5
f = 3.1415926
b = False
l = [1, 2, 3]
t = (4, 5, 6)
d = {1: 'one', 2: 'two', 3: 'three'}
print(sys.getsizeof(i))  # 28
print(sys.getsizeof(f))  # 24
print(sys.getsizeof(b))  # 24
print(sys.getsizeof(l))  # 64
print(sys.getsizeof(t))  # 48
print(sys.getsizeof(d))  # 240

从输出结果中可以看出,Python中int类型占用28个字节,floatbool类型占用24个字节,list类型占用64个字节,tuple类型占用48个字节,dict类型占用240个字节。

二、变量占用字节数

除了数据类型,变量本身也会占用一定的字节数。在Python中,变量实际上是一个指向对象内存地址的指针。因此,即使是一个空的变量,也会占用一定的内存。下面的代码演示了一些变量在占用内存时的一些差异:

import sys
a = 5
b = 'hello'
c = [1, 2, 3]
d = {'one': 1, 'two': 2, 'three': 3}
e = []
f = ()
print(sys.getsizeof(a))  # 28
print(sys.getsizeof(b))  # 62
print(sys.getsizeof(c))  # 88
print(sys.getsizeof(d))  # 240
print(sys.getsizeof(e))  # 56
print(sys.getsizeof(f))  # 48

可以看到,int类型的变量占用28个字节,字符串类型的变量占用62个字节,list类型的变量占用88个字节,dict类型的变量占用240个字节。同时,即使是一个空的listtuple,也分别占用了56和48个字节。

三、垃圾回收机制

Python中的垃圾回收机制对于内存的使用也有一定的影响。在Python中,除了引用计数,还有一种垃圾回收机制叫做循环垃圾回收机制。当一个对象没有被引用时,垃圾回收器会将其清理掉。但是当一个对象被删除时,它所包含的子对象不一定会被立即清理。 以下代码演示了一个示例。当删除一个对象时,它所包含的子对象不一定会被立即清理,需要等到垃圾回收器运作时才能清理:

import sys
import gc
class A(object):
    def __init__(self):
        self.b = B(self)
class B(object):
    def __init__(self, a):
        self.a = a
a = A()
print(sys.getsizeof(a))  # 48
a = None
gc.collect()

在上面的示例中,A实例中包含一个B实例,而B实例又包含一个指向A实例的引用。当删除A实例时,它所包含的B实例并不会立即被清理。只有在运行垃圾回收器时,才会清理掉这个B实例。因此,在实际应用中,需要格外注意循环引用的情况。

四、字节码编译

Python中的字节码编译也会对内存使用产生影响。对于一个函数来说,它的字节码不仅要占用一部分内存,而且每次调用函数时,都需要重新编译一次函数的字节码。 以下代码演示了字节码编译对内存使用的影响:

import sys
def test():
    i = 5
    j = 10
    k = 15
    return i + j + k
print(sys.getsizeof(test))  # 136

上面的代码演示了一个简单的函数,内部只创建了3个变量。不过,即使这个函数很短,它的字节码编译占用了136个字节。

五、内存分配、释放和复用

Python中的内存分配、释放和复用机制也会对内存使用产生影响。对于比较小的对象,Python会采用内存池机制进行分配和释放,以避免频繁的调用操作系统的内存分配和释放函数。同时,在一些情况下,Python也会采用内存复用机制进行优化,从而避免不必要的内存分配。 以下代码演示了Python的内存池和内存复用机制:

import sys
a = 1000
b = 1000
print(id(a))  # 139933595660672
print(id(b))  # 139933595660672
print(sys.getsizeof(a))  # 28
c = [1, 2, 3]
d = [1, 2, 3]
print(id(c))  # 139933596098880
print(id(d))  # 139933595632320
print(sys.getsizeof(c))  # 64

上面的代码演示了两个示例。在第一个示例中,Python对于比较小的int数据类型采用了内存复用机制,因此,变量ab的内存地址是一样的,并且它们所占用的字节数也很小。而在第二个示例中,list类型的数据较大,因此Python并没有采用内存复用机制,变量cd的内存地址不一样,并且它们所占用的字节数也较大。