Python对象的内存占用分析
Python提供的sys
模块中,有一个getsizeof()
函数可以返回对象的占用字节数。
一、数据类型的占用字节数
Python支持的内置数据类型,包括int
、float
、bool
、list
、tuple
、dict
等等。但是它们各自所占用的字节数是不同的,通过getsizeof()
函数可以输出它们的实际占用字节数:
import sys
i = 5
f = 3.1415926
b = False
l = [1, 2, 3]
t = (4, 5, 6)
d = {1: 'one', 2: 'two', 3: 'three'}
print(sys.getsizeof(i)) # 28
print(sys.getsizeof(f)) # 24
print(sys.getsizeof(b)) # 24
print(sys.getsizeof(l)) # 64
print(sys.getsizeof(t)) # 48
print(sys.getsizeof(d)) # 240
从输出结果中可以看出,Python中int
类型占用28个字节,float
和bool
类型占用24个字节,list
类型占用64个字节,tuple
类型占用48个字节,dict
类型占用240个字节。
二、变量占用字节数
除了数据类型,变量本身也会占用一定的字节数。在Python中,变量实际上是一个指向对象内存地址的指针。因此,即使是一个空的变量,也会占用一定的内存。下面的代码演示了一些变量在占用内存时的一些差异:
import sys
a = 5
b = 'hello'
c = [1, 2, 3]
d = {'one': 1, 'two': 2, 'three': 3}
e = []
f = ()
print(sys.getsizeof(a)) # 28
print(sys.getsizeof(b)) # 62
print(sys.getsizeof(c)) # 88
print(sys.getsizeof(d)) # 240
print(sys.getsizeof(e)) # 56
print(sys.getsizeof(f)) # 48
可以看到,int
类型的变量占用28个字节,字符串类型的变量占用62个字节,list
类型的变量占用88个字节,dict
类型的变量占用240个字节。同时,即使是一个空的list
和tuple
,也分别占用了56和48个字节。
三、垃圾回收机制
Python中的垃圾回收机制对于内存的使用也有一定的影响。在Python中,除了引用计数,还有一种垃圾回收机制叫做循环垃圾回收机制。当一个对象没有被引用时,垃圾回收器会将其清理掉。但是当一个对象被删除时,它所包含的子对象不一定会被立即清理。 以下代码演示了一个示例。当删除一个对象时,它所包含的子对象不一定会被立即清理,需要等到垃圾回收器运作时才能清理:
import sys
import gc
class A(object):
def __init__(self):
self.b = B(self)
class B(object):
def __init__(self, a):
self.a = a
a = A()
print(sys.getsizeof(a)) # 48
a = None
gc.collect()
在上面的示例中,A
实例中包含一个B
实例,而B
实例又包含一个指向A
实例的引用。当删除A
实例时,它所包含的B
实例并不会立即被清理。只有在运行垃圾回收器时,才会清理掉这个B
实例。因此,在实际应用中,需要格外注意循环引用的情况。
四、字节码编译
Python中的字节码编译也会对内存使用产生影响。对于一个函数来说,它的字节码不仅要占用一部分内存,而且每次调用函数时,都需要重新编译一次函数的字节码。 以下代码演示了字节码编译对内存使用的影响:
import sys
def test():
i = 5
j = 10
k = 15
return i + j + k
print(sys.getsizeof(test)) # 136
上面的代码演示了一个简单的函数,内部只创建了3个变量。不过,即使这个函数很短,它的字节码编译占用了136个字节。
五、内存分配、释放和复用
Python中的内存分配、释放和复用机制也会对内存使用产生影响。对于比较小的对象,Python会采用内存池机制进行分配和释放,以避免频繁的调用操作系统的内存分配和释放函数。同时,在一些情况下,Python也会采用内存复用机制进行优化,从而避免不必要的内存分配。 以下代码演示了Python的内存池和内存复用机制:
import sys
a = 1000
b = 1000
print(id(a)) # 139933595660672
print(id(b)) # 139933595660672
print(sys.getsizeof(a)) # 28
c = [1, 2, 3]
d = [1, 2, 3]
print(id(c)) # 139933596098880
print(id(d)) # 139933595632320
print(sys.getsizeof(c)) # 64
上面的代码演示了两个示例。在第一个示例中,Python对于比较小的int
数据类型采用了内存复用机制,因此,变量a
和b
的内存地址是一样的,并且它们所占用的字节数也很小。而在第二个示例中,list
类型的数据较大,因此Python并没有采用内存复用机制,变量c
和d
的内存地址不一样,并且它们所占用的字节数也较大。