打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
《源码探秘 CPython》67. 回顾 Python 的对象模型

从现在开始,我们将进入新的篇章,来分析 Python 的类是怎么实现的?我们知道 Pytho是一个面向对象的语言,而 C 不是。那么在 Python 的底层,是如何使用 C 来支持面向对象的功能呢?带着这些疑问,我们下面开始剖析类的实现机制。

另外,在 Python2 中存在着经典类(classic class)和新式类(new style class),但是到 Python3,经典类已经消失了。加上 Python2 官方都不维护了,因此我们只会介绍新式类。

下面来重温一下对象的关系模型。

在面向对象的理论中,有两个核心的概念:类和实例。类可以看成是一个模板,那么实例就是根据这个模板创建出来的对象。可以想象成 Docker 的镜像和容器。但是在 Python 里面,类和实例都是对象,类叫做类对象、或者类型对象,实例叫做实例对象。

为了避免后续出现歧义,我们这里把对象分为三种:

  • 内置类对象:比如int、str、list、type、object等等;

  • 自定义类对象:通过class关键字定义的类,当然后面我们也会把它和上面的内置类对象统称为类对象(或者说类型对象);

  • 实例对象:由类对象(内建类对象或自定义类对象)创建的实例;

而对象之间存在以下两种关系:

  • is-kind-of:对应面向对象理论中父类和子类之间的关系;

  • is-instance-of:对应面向对象理论中类和实例之间的关系;

class Girl(object):
def say(self): return "古明地觉"
girl = Girl()print(girl.say()) # 古明地觉

这段代码中便包含了上面的三种对象:object(内置类对象),Girl(自定义类对象),girl(实例对象)。

显然 Girl 和 object 之间是 is-kind-of 关系,即 object 是 Girl 的父类。另外值得一提的是,Python3 里面所有的类(除object)都是默认继承自 object,即便我们这里不显式继承 object,也会默认继承的,为了说明,我们就写上了。

除了 object 是 Girl 的父类,我们还能看出 girl 和 Girl 之间存在 is-instance-of 关系,即 girl 是 Girl 的实例。当然如果再进一步的话,girl 和 object 之间也存在 is-instance-of 关系,girl 也是 object 的实例。

class Girl(object):    pass    girl = Girl()print(issubclass(Girl, object))  # True print(type(girl))  # <class '__main__.Girl'>print(isinstance(girl, Girl))  # Trueprint(isinstance(girl, object))  # True

girl 是 Girl 这个类实例化得到的,所以 type(girl) 得到的是类对象 Girl。但 girl 也是 object 的实例对象,因为 Girl 继承了 object。至于这其中的原理,我们会慢慢介绍到。

Python 也提供了一些手段可以探测这些关系,除了上面的 type 之外,还可以使用对象的 __class__ 属性探测一个对象和其它的哪些对象之间存在 is-instance-of 关系。

而通过对象的 __bases__ 属性则可以探测一个对象和其它的哪些对象之间存在着 is-kind-of 关系。此外 Python 还提供了两个函数 issubclass 和 isinstance 来验证两个对象之间是否存在着我们期望的关系。

class Girl(object):    pass 
girl = Girl()print(girl.__class__) # <class '__main__.Girl'>print(Girl.__class__) # <class 'type'>#__class__是查看自己的类型是什么,也就是生成自己的类#而在介绍Python对象的时候,我们就看到了#任何一个对象都至少具备两个东西: 一个是引用计数、一个是类型#所以__class__是所有对象都具备的
# __base__只显示继承的第一个类print(Girl.__base__) # <class 'object'># __bases__会显示继承的所有类print(Girl.__bases__) # (<class 'object'>,)


关于 type 和 object 的关系,我们在最开始介绍对象模型的时候已经说过了。

type 底层的结构体是PyType_Type、object底层的结构体是PyBaseObject_Type。在创建 object 的时候,将内部的 ob_type 设置成了&PyType_Type;在创建type的时候,将内部的 tp_base 设置成了&PyBaseObject_Type。

因此这两者的定义是彼此依赖的,两者是同时出现的,我们后面还会看到。

紧接着我们考察一下类对象 Girl 的行为,我们看到它支持属性设置:

class Girl(object):    pass
print(hasattr(Girl, "name")) # FalseGirl.name = "古明地觉"print(hasattr(Girl, "name")) # Trueprint(Girl.name) # 古明地觉

一个类都已经定义完了,我们后续还可以进行属性添加,这在其它的静态语言中是不可能做到的。那么Python是如何做到的呢?我们说能够对属性进行动态添加,你会想到什么?是不是字典呢?正如global名字空间一样,我们猜测类应该也有自己的属性字典,往类里面设置属性的时候,等价于向字典中添加键值对,同理其它操作也与之类似。

class Girl(object):    pass
print(Girl.__dict__.get("name", "不存在")) # 不存在Girl.name = "古明地觉"print(Girl.__dict__.get("name")) # 古明地觉

和操作全局变量是类似的,但是有一点需要注意:我们不能直接通过类的属性字典来设置属性。

try:    Girl.__dict__["name"] = "古明地觉"except Exception as e:    print(e)  # 'mappingproxy' object does not support item assignment

虽然叫做属性字典,但其实是mappingproxy对象,该对象本质上就是对字典进行了封装,在字典的基础上移除了增删改操作,也就是只保留了查询功能。如果我们想给类增加属性,可以采用直接赋值的方式,或者调用 setattr 函数也是可以的。

但我们之前介绍过一个骚操作,可以通过 gc 模块拿到 mappingproxy 对象里的字典。

import gc
class Girl(object): pass
gc.get_referents(Girl.__dict__)[0]["name"] = "古明地觉"print(Girl.name) # 古明地觉

并且这种做法除了适用于自定义类对象,还适用于内置类对象。但是工作中不要这么做,知道有这么个操作就行。

除了设置属性之外,我们还可以设置函数。

class Girl(object):    pass
Girl.info = lambda name: f"我是{name}"print(Girl.info("古明地觉")) # 我是古明地觉
# 如果实例调用的话,会和我们想象的不太一样# 因为实例调用的话会将函数包装成方法try: Girl().info("古明地觉")except TypeError as e:    print(e) """<lambda>() takes 1 positional argument but 2 were given"""    
# 实例在调用的时候会将自身也作为参数传进去# 所以第一个参数 name 实际上接收的是 Girl 的实例对象# 只不过第一个参数按照规范来讲应该叫做self# 但即便你起别的名字也是无所谓的print(Girl().info()) """我是<__main__.Girl object at 0x000001920BB88760>"""

所以我们可以有两种做法:

# 将其包装成一个静态方法# 这样类和实例都可以调用Girl.info = staticmethod(lambda name: f"我是{name}")print(Girl.info("古明地觉"))  # 我是古明地觉print(Girl().info("古明地觉"))  # 我是古明地觉
# 如果是给实例用的,那么带上一个 self 参数即可Girl.info = lambda self, name: f"我是{name}"print(Girl().info("古明地觉")) # 我是古明地觉

此外我们还可以通过type来动态地往类里面进行属性的增加、修改和删除。

class Girl(object):
def say(self): pass
print(hasattr(Girl, "say")) # True# delattr(Girl, "say") 与之等价type.__delattr__(Girl, "say")print(hasattr(Girl, "say")) # False# 我们设置一个属性吧# 等价于 Girl.name = "古明地觉"setattr(Girl, "name", "古明地觉")print(Girl.name) # 古明地觉

事实上调用 getattr、setattr、delattr 等价于调用其类型对象的__getattr__、__setattr__、__delattr__。

所以,一个对象支持哪些行为,取决于其类型对象定义了哪些操作。并且通过对象的类型对象,可以动态地给该对象进行属性的设置。Python所有类型对象的类型对象都是 type,通过type我们便可以控制类的生成过程,即便类已经创建完毕了,也依旧可以进行属性设置。

但是注意:上面说的仅仅针对我们自定义的类,内置的类是不行的。

try:    int.name = "古明地觉"except Exception as e:    print(e)"""can't set attributes of built-in/extension type 'int'"""        try:    int.__add__ = "xxx"except Exception as e:    print(e) """can't set attributes of built-in/extension type 'int'     """

通过报错信息可以看到,不可以设置内置类和扩展类的属性。因为内置类对象在解释器启动之后,就已经初始化好了。至于扩展类就是我们使用Python/C API编写的扩展模块中的类,它和内置类是等价的。

因此内置的类和使用class定义的类本质上是一样的,都是PyTypeObject对象,它们的类型在Python里面都是type。但区别就是内置的类在底层是静态初始化的,我们不能进行属性的动态设置(通过 gc 模块实现除外)。

但是为什么不可以对内置类和扩展类进行属性设置呢?首先我们要知道Python的动态特性是虚拟机赐予的,而虚拟机的工作就是将PyCodeObject对象翻译成C的代码进行执行,所以Python的动态特性就是在这一步发生的。

而内置的类(int、str、list等等)在解释器启动之后就已经静态初始化好了,直接指向 C 一级的数据结构,同理扩展类也是如此。它们相当于绕过了解释执行这一步,所以它们的属性不可以动态添加。

不光内置的类本身,还有它的实例对象也是如此。

a = 123print(hasattr(a, "__dict__"))  # False

我们看到它连自己的属性字典都没有,因为内置类对象的实例对象,内部有哪些属性,解释器记得清清楚楚。它们在底层都已经写死了,并且不允许修改,因此虚拟机完全没有必要为其实现属性字典(节省了内存占用)。

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
【Python】 如何动态添加类属性与方法
[Python]年度黑马Python 自省指南
python中类的全面分析
python中类及其实例详解
刻意练习:Python基础 -- Task10. 类与对象
python核心知识点1
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服