《流畅的Python》试读：1.2 　如何使用特殊方法

首先明确一点，特殊方法的存在是为了被Python 解释器调用的，你自己并不需要调用它们。也就是说没有my_object.__len__() 这种写法，而应该使用len(my_object)。在执行len(my_object) 的时候，如果my_object 是一个自定义类的对象，那么Python 会自己去调用其中由你实现的__len__ 方法。然而如果是Python 内置的类型，比如列表（list）、字符串（str）、字节序列（bytearray）等，那么CPython 会抄个近路，__len__ 实际上会直接返回PyVarObject 里的ob_size 属性。PyVarObject 是表示内存中长度可变的内置对象的C 语言结构体。直接读取这个值比调用一个方法要快很多。很多时候，特殊方法的调用是隐式的，比如for i in x: 这个语句，背后其实用的是iter(x)，而这个函数的背后则是x.__iter__() 方法。当然前提是这个方法在x 中被实现了。通常你的代码无需直接使用特殊方法。除非有大量的元编程存在，直接调用特殊方法的频率应该远远低于你去实现它们的次数。唯一的例外可能是__init__ 方法，你的代码里可能经常会用到它，目的是在你自己的子类的__init__ 方法中调用超类的构造器。通过内置的函数（例如len、iter、str，等等）来使用特殊方法是最好的选择。这些内置函数不仅会调用特殊方法，通常还提供额外的好处，而且对于内置的类来说，它们的速度更快。14.12 节中有详细的例子。不要自己想当然地随意添加特殊方法，比如__foo__ 之类的，因为虽然现在这个名字没有被Python 内部使用，以后就不一定了。 1.2.1 　模拟数值类型利用特殊方法，可以让自定义对象通过加号“+”（或是别的运算符）进行运算。第13 章对此有详细的介绍，现在只是借用这个例子来展示特殊方法的使用。我们来实现一个二维向量（vector）类，这里的向量就是欧几里得几何中常用的概念，常在数学和物理中使用的那个（见图1-1）。图1-1：一个二维向量加法的例子，Vector(2,4) + Vextor(2,1) = Vector(4,5) Python 内置的complex 类可以用来表示二维向量，但我们这个自定义的类可以扩展到n 维向量，详见第14 章。为了给这个类设计API，我们先写个模拟的控制台会话来做doctest。下面这一段代码就是图1-1 所示的向量加法： >>> v1 = Vector(2, 4) >>> v2 = Vector(2, 1) >>> v1 + v2 Vector(4, 5) 注意其中的+ 运算符所得到的结果也是一个向量，而且结果能被控制台友好地打印出来。 abs 是一个内置函数，如果输入是整数或者浮点数，它返回的是输入值的绝对值；如果输入是复数（complex number），那么返回这个复数的模。为了保持一致性，我们的API 在碰到abs 函数的时候，也应该返回该向量的模： >>> v = Vector(3, 4) >>> abs(v) 5.0 我们还可以利用* 运算符来实现向量的标量乘法（即向量与数的乘法，得到的结果向量的方向与原向量一致6，模变大）： >>> v * 3 Vector(9, 12) >>> abs(v * 3) 15.0 示例1-2 包含了一个Vector 类的实现，上面提到的操作在代码里是用这些特殊方法实现的：__repr__、__abs__、 __add__ 和 __mul__。示例1-2　一个简单的二维向量类 from math import hypot class Vector: def __init__(self, x=0, y=0): self.x = x self.y = y def __repr__(self): return 'Vector(%r, %r)' % (self.x, self.y) def __abs__(self): return hypot(self.x, self.y) def __bool__(self): return bool(abs(self)) def __add__(self, other): x = self.x + other.x y = self.y + other.y return Vector(x, y) def __mul__(self, scalar): return Vector(self.x * scalar, self.y * scalar) 注6：如果向量与负数相乘，得到的结果向量的方向与原向量相反。——编者注虽然代码里有6 个特殊方法，但这些方法（除了__init__）并不会在这个类自身的代码中使用。即便其他程序要使用这个类的这些方法，也不会直接调用它们，就像我们在上面的控制台对话中看到的。上文也提到过，一般只有Python 的解释器会频繁地直接调用这些方法。接下来看看每个特殊方法的实现。 1.2.2 　字符串表示形式 Python 有一个内置的函数叫repr，它能把一个对象用字符串的形式表达出来以便辨认，这就是“字符串表示形式”。repr 就是通过__repr__ 这个特殊方法来得到一个对象的字符串表示形式的。如果没有实现__repr__，当我们在控制台里打印一个向量的实例时，得到的字符串可能会是<Vector object at 0x10e100070>。交互式控制台和调试程序（debugger）用repr 函数来获取字符串表示形式；在老的使用% 符号的字符串格式中，这个函数返回的结果用来代替%r 所代表的对象；同样，str.format 函数所用到的新式字符串格式化语法（https://docs.python.org/2/library/string.html#format-string-syntax）也是利用了repr，才把!r 字段变成字符串。 % 和str.format 这两种格式化字符串的手段在本书中都会使用。其实整个Python 社区都在同时使用这两种方法。个人来讲，我越来越喜欢str.format 了，但是Python 程序员更喜欢简单的%。因此，这两种形式并存的情况还会持续下去。在__repr__ 的实现中，我们用到了%r 来获取对象各个属性的标准字符串表示形式——这是个好习惯，它暗示了一个关键：Vector(1, 2) 和Vector('1', '2') 是不一样的，后者在我们的定义中会报错，因为向量对象的构造函数只接受数值，不接受字符串7。 __repr__ 所返回的字符串应该准确、无歧义，并且尽可能表达出如何用代码创建出这个被打印的对象。因此这里使用了类似调用对象构造器的表达形式（比如Vector(3, 4) 就是个例子）。 __repr__ 和__str__ 的区别在于，后者是在str() 函数被使用，或是在用print 函数打印一个对象的时候才被调用的，并且它返回的字符串对终端用户更友好。如果你只想实现这两个特殊方法中的一个，__repr__ 是更好的选择，因为如果一个对象没有__str__ 函数，而Python 又需要调用它的时候，解释器会用__repr__ 作为替代。 “Difference between __str__ and __repr__ in Python”（http://stackoverflow.com/ questions/1436703/difference-between-str-and-repr-in-python）是Stack Overflow 上的一个问题，Python 程序员Alex Martelli 和Martijn Pieters 的回答很精彩。注7：实际上，Vector 的构造函数接受字符串。而且，对于使用字符串构造的Vector，这6 个特殊方法中，只有__abs__ 和__bool__ 会报错。此外，1.2.4 节定义的__bool__ 不会报错。——编者注 1.2.3 　算术运算符通过__add__ 和__mul__，示例1-2 为向量类带来了+ 和* 这两个算术运算符。值得注意的是，这两个方法的返回值都是新创建的向量对象，被操作的两个向量（self 或other）还是原封不动，代码里只是读取了它们的值而已。中缀运算符的基本原则就是不改变操作对象，而是产出一个新的值。第13 章会谈到更多这方面的问题。示例1-2 只实现了数字做乘数、向量做被乘数的运算，乘法的交换律则被忽略了。在第13 章里，我们将利用__rmul__ 解决这个问题。 1.2.4 　自定义的布尔值尽管Python 里有bool 类型，但实际上任何对象都可以用于需要布尔值的上下文中（比如if 或while 语句，或者and、or 和not 运算符）。为了判定一个值x 为真还是为假，Python 会调用bool(x)，这个函数只能返回True 或者False。默认情况下，我们自己定义的类的实例总被认为是真的，除非这个类对__bool__ 或者__ len__ 函数有自己的实现。bool(x) 的背后是调用x.__bool__() 的结果；如果不存在__ bool__ 方法，那么bool(x) 会尝试调用x.__len__()。若返回0，则bool 会返回False；否则返回True。我们对__bool__ 的实现很简单，如果一个向量的模是0，那么就返回False，其他情况则返回True。因为__bool__ 函数的返回类型应该是布尔型，所以我们通过bool(abs(self)) 把模值变成了布尔值。在Python 标准库的文档中，有一节叫作“Built-in Types”（https://docs.python.org/3/library/ stdtypes.html#truth），其中规定了真值检验的标准。通过实现__bool__，你定义的对象就可以与这个标准保持一致。如果想让Vector.__bool__ 更高效，可以采用这种实现： def __bool__(self): return bool(self.x or self.y) 它不那么易读，却能省掉从abs 到__abs__ 到平方再到平方根这些中间步骤。通过bool 把返回类型显式转换为布尔值是为了符合__bool__ 对返回值的规定，因为or 运算符可能会返回x 或者y 本身的值：若x 的值等价于真，则or 返回x 的值；否则返回y 的值。

1.1 　一摞Python风格的纸牌回试读目录 1.3 　特殊方法一览

>流畅的Python

作者: [巴西] Luciano Ramalho
isbn: 7115454159
页数: 628
定价: 139元
出品方: 图灵教育
装帧: 平装
出版年: 2017-5-15
原作名: Fluent Python
书名: 流畅的Python
译者: 安道, 吴珂
出版社: 人民邮电出版社

《流畅的Python》试读：1.2 如何使用特殊方法

《流畅的Python》试读：1.2 　如何使用特殊方法