Python中的 is 和 == 以及字符串驻留机制详解
is和==
先了解下官方文档中关于is和==的概念。is表示的是对象标示符(objectidentity),而==表示的是相等(equality);is的作用是用来检查对象的标示符是否一致,也就是比较两个对象在内存中的地址是否一样(相当于检查id(a)==id(b)),而==是用来检查两个对象引用的值是否相等(相当于检查a.eq(b));这点和Java有点类似,只不过Java中是用==来比较两个对象在内存中的地址,用equals()来检查两者之间的值是否相等。
is | == | |
---|---|---|
概念 | 对象标示符 | 相等 |
作用 | 比较对象在内存中的地址 | 检查两个对象引用的值 |
示例 | id(a)==id(b) | a.eq(b) |
字符串驻留机制
Python中的字符串采用了intern机制,当需要值相同的字符串的时候(比如标识符),可以直接从字符串池里拿来使用,避免频繁的创建和销毁,提升效率和节约内存,因此拼接和修改字符串是会比较影响性能的。
因为是不可变的,所以字符串的操作都不是replace,而是新建对象,这也是为什么拼接多字符串的时候不建议用+而用join(),join()是先计算出所有字符串的长度,然后再拷贝,只new一次对象。
需要注意的是,并不是所有的字符串都会采用intern机制,当且仅当只包含下划线、数字、字母的字符串才会被intern。
相关示例
示例一
a="hello" b="hello" print(aisb)#输出True print(a==b)#输出True
值相同的简单字符串对象在字符串池里只会保存一份,这决定了字符串必须是不可变对象,所以a和b是同一个对象
示例二
a="helloworld" b="helloworld" print(aisb)#输出False print(a==b)#输出True
a和b中都有空格,所以不会被intern(空格不是python标识符),故a和b不是同一个对象。注意,这仅仅是在交互式命令行中执行,而在PyCharm或者保存为文件执行,结果是不一样的,主要是因为解释器做了一部分优化
示例三
a='ab'+'c'is'abc' print(a)#输出True ab='ab' b=ab+'c'is'abc' print(b)#输出False
第一个'ab'+'c'是在compile-time(编译期)求值的,被替换成了'abc',所以输出为True;第二个示例,ab+'c'是在run-time(运行期)拼接的,导致没有被自动intern
示例四
a=[1,2,3] b=[1,2,3] print(aisb)#输出False print(a==b)#输出True
a和b是列表,不是同一个对象
示例五
a=[1,2,3] b=a print(aisb)#输出True print(a==b)#输出True
把a的引用复制给b(引用赋值),在内存中其实是指向同一个对象
示例六
a=["I","love","Python"] b=a[:] print(aisb)#输出False print(a==b)#输出True print(a[0]isb[0])#输出True print(a[0]==b[0])#输出True
b通过切片操作重新分配了对象(切片赋值),但值和a相同。由于切片拷贝是浅拷贝,这说明列表中的元素并未重新创建,因此a[0]isb[0]输出为True
示例七
a=1 b=1 print(aisb)#输出True print(a==b)#输出True
Python会对比较小的整数对象进行缓存,下次用的时候直接从缓存中获取
示例八
a=320 b=320 print(aisb)#输出False print(a==b)#输出True
Python仅仅对比较小的整数对象进行缓存(范围为范围[-5,256]),而并非是所有整数对象。注意,这仅仅是在交互式命令行中执行,而在PyCharm或者保存为文件执行,结果是不一样的,主要是因为解释器做了一部分优化
is与==对比
is与==相比计算速度会更快,因为它不能重载,不用进行特殊的函数调用,通过直接比较两个整数id,减少了函数调用的开销。而a==b则是等同于a.eq(b),继承自object的eq方法原本也是比较两个对象的id,结果与is一样,但大多数Python对象会覆盖重写object的eq方法,而定义内容的相关比较,所以比较的是对象属性的值。
在变量和单例值之间比较时,应该使用is。目前,最常使用is的地方是当判断对象是不是None,下面是推荐的写法:xxxisNone;判断不是None的推荐写法是:xxxisnotNone
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持毛票票。