Python对象的内存占用分析

Python提供的sys模块中，有一个getsizeof()函数可以返回对象的占用字节数。

一、数据类型的占用字节数

Python支持的内置数据类型，包括int、float、bool、list、tuple、dict等等。但是它们各自所占用的字节数是不同的，通过getsizeof()函数可以输出它们的实际占用字节数：

import sys
i = 5
f = 3.1415926
b = False
l = [1, 2, 3]
t = (4, 5, 6)
d = {1: 'one', 2: 'two', 3: 'three'}
print(sys.getsizeof(i))  # 28
print(sys.getsizeof(f))  # 24
print(sys.getsizeof(b))  # 24
print(sys.getsizeof(l))  # 64
print(sys.getsizeof(t))  # 48
print(sys.getsizeof(d))  # 240

从输出结果中可以看出，Python中int类型占用28个字节，float和bool类型占用24个字节，list类型占用64个字节，tuple类型占用48个字节，dict类型占用240个字节。

二、变量占用字节数

除了数据类型，变量本身也会占用一定的字节数。在Python中，变量实际上是一个指向对象内存地址的指针。因此，即使是一个空的变量，也会占用一定的内存。下面的代码演示了一些变量在占用内存时的一些差异：

import sys
a = 5
b = 'hello'
c = [1, 2, 3]
d = {'one': 1, 'two': 2, 'three': 3}
e = []
f = ()
print(sys.getsizeof(a))  # 28
print(sys.getsizeof(b))  # 62
print(sys.getsizeof(c))  # 88
print(sys.getsizeof(d))  # 240
print(sys.getsizeof(e))  # 56
print(sys.getsizeof(f))  # 48

可以看到，int类型的变量占用28个字节，字符串类型的变量占用62个字节，list类型的变量占用88个字节，dict类型的变量占用240个字节。同时，即使是一个空的list和tuple，也分别占用了56和48个字节。

三、垃圾回收机制

Python中的垃圾回收机制对于内存的使用也有一定的影响。在Python中，除了引用计数，还有一种垃圾回收机制叫做循环垃圾回收机制。当一个对象没有被引用时，垃圾回收器会将其清理掉。但是当一个对象被删除时，它所包含的子对象不一定会被立即清理。以下代码演示了一个示例。当删除一个对象时，它所包含的子对象不一定会被立即清理，需要等到垃圾回收器运作时才能清理：

import sys
import gc
class A(object):
    def __init__(self):
        self.b = B(self)
class B(object):
    def __init__(self, a):
        self.a = a
a = A()
print(sys.getsizeof(a))  # 48
a = None
gc.collect()

在上面的示例中，A实例中包含一个B实例，而B实例又包含一个指向A实例的引用。当删除A实例时，它所包含的B实例并不会立即被清理。只有在运行垃圾回收器时，才会清理掉这个B实例。因此，在实际应用中，需要格外注意循环引用的情况。

四、字节码编译

Python中的字节码编译也会对内存使用产生影响。对于一个函数来说，它的字节码不仅要占用一部分内存，而且每次调用函数时，都需要重新编译一次函数的字节码。以下代码演示了字节码编译对内存使用的影响：

import sys
def test():
    i = 5
    j = 10
    k = 15
    return i + j + k
print(sys.getsizeof(test))  # 136

上面的代码演示了一个简单的函数，内部只创建了3个变量。不过，即使这个函数很短，它的字节码编译占用了136个字节。

五、内存分配、释放和复用

Python中的内存分配、释放和复用机制也会对内存使用产生影响。对于比较小的对象，Python会采用内存池机制进行分配和释放，以避免频繁的调用操作系统的内存分配和释放函数。同时，在一些情况下，Python也会采用内存复用机制进行优化，从而避免不必要的内存分配。以下代码演示了Python的内存池和内存复用机制：

import sys
a = 1000
b = 1000
print(id(a))  # 139933595660672
print(id(b))  # 139933595660672
print(sys.getsizeof(a))  # 28
c = [1, 2, 3]
d = [1, 2, 3]
print(id(c))  # 139933596098880
print(id(d))  # 139933595632320
print(sys.getsizeof(c))  # 64

上面的代码演示了两个示例。在第一个示例中，Python对于比较小的int数据类型采用了内存复用机制，因此，变量a和b的内存地址是一样的，并且它们所占用的字节数也很小。而在第二个示例中，list类型的数据较大，因此Python并没有采用内存复用机制，变量c和d的内存地址不一样，并且它们所占用的字节数也较大。