发布于2019-03-03 11:31 阅读(15178) 评论(0) 点赞(57) 收藏(16)
平时时不时会面面实习生,大多数的同学在学校里都已经掌握了Python。面试的时候要求同学们实现一个简单的函数,交换两个变量的值,大多数的同学给出的都是如下的答案
实际上,Python中还有更简洁的更具Python风格的实现,如下
相比前一种方法,后一种方法节省一个中间变量,在性能上也优于前一种方法。
我们从Python的字节码来深入分析一下原因。
dis是个反汇编工具,将Python代码翻译成字节码指令。这里的输出如下
通过字节码可以看到,swap1和swap2最大的区别在于,swap1中通过ROT_TWO交换栈顶的两个元素实现x和y值的互换,swap2中引入了tmp变量,多了一次LOAD_FAST, STORE_FAST的操作。执行一个ROT_TWO指令比执行一个LOAD_FAST+STORE_FAST的指令快,这也是为什么swap1比swap2性能更好的原因。
上面的输出结果中为什么有的 is 和 == 的结果相同,有的不相同呢?我们来看下官方文档中对于 is 和 == 的解释。
官方文档中说 is 表示的是对象标示符(object identity),而 == 表示的是相等(equality)。is 的作用是用来检查对象的标示符是否一致,也就是比较两个对象在内存中的地址是否一样,而 == 是用来检查两个对象是否相等。
我们在检查 a is b 的时候,其实相当于检查 id(a) == id(b)。而检查 a == b 的时候,实际是调用了对象 a 的 __eq()__ 方法,a == b 相当于 a.__eq__(b)。
一般情况下,如果 a is b 返回True的话,即 a 和 b 指向同一块内存地址的话,a == b 也返回True,即 a 和 b 的值也相等。
好了,看明白上面的解释后,我们来看下前面的几个例子
打印出 id(a) 和 id(b) 后就很清楚了。只要 a 和 b 的值相等,a == b 就会返回True,而只有 id(a) 和 id(b) 相等时,a is b 才返回 True。
这里还有一个问题,为什么 a 和 b 都是 "hello" 的时候,a is b 返回True,而 a 和 b都是 "hello world" 的时候,a is b 返回False呢?
这是因为前一种情况下Python的字符串驻留机制起了作用。对于较小的字符串,为了提高系统性能Python会保留其值的一个副本,当创建新的字符串的时候直接指向该副本即可。所以 "hello" 在内存中只有一个副本,a 和 b 的 id 值相同,而 "hello world" 是长字符串,不驻留内存,Python中各自创建了对象来表示 a 和 b,所以他们的值相同但 id 值不同。
同学指出:intern机制和字符串长短无关,在交互模式下,每行字符串字面量都会申请一个新字符串,但是只含大小写字母、数字和下划线的会被intern,也就是维护了一张dict来使得这些字符串全局唯一)
总结一下,is 是检查两个对象是否指向同一块内存空间,而 == 是检查他们的值是否相等。可以看出,is 是比 == 更严格的检查,is 返回True表明这两个对象指向同一块内存,值也一定相同。
看到这里,大家是不是搞懂了 is 和 == 的区别呢?
那我们深入一步来思考一下下面这个问题:
Python里和None比较时,为什么是 is None 而不是 == None 呢?
欢迎回答在评论区~
好了,解答就到这里,我们开始本篇的正题。
Python中有可变对象和不可变对象之分。可变对象创建后可改变但地址不会改变,即变量指向的还是原来的变量;不可变对象创建之后便不能改变,如果改变则会指向一个新的对象。
Python中dict、list是可变对象,str、int、tuple、float是不可变对象。
来看一个字符串的例子
上面的例子里,修改a指向的对象的值会导致抛出异常。
执行 a = a + " world"时,先计算等号右边的表达式,生成一个新的对象赋值到变量a,因此a指向的对象发生了改变,id(a) 的值也与原先不同。
再来看一个列表的例子
上面对a修改元素、添加元素,变量a还是指向原来的对象。
将a赋值给b后,变量b和a都指向同一个对象,因此修改b的元素值也会影响a。
变量c是对b的切片操作的返回值,切片操作相当于浅拷贝,会生成一个新的对象,因此c指向的对象不再是b所指向的对象,对c的操作不会改变b的值。
理解了上面不可变对象和可变对象的区别后,我们再来看一个有趣的问题
明明group1和group2是不同的对象(id值不同),为什么调用group2的add_member方法会影响group1的members?
其中的奥妙就在于__init__函数的第二个参数是默认参数,默认参数的默认值在函数创建的时候就生成了,每次调用都是用了这个对象的缓存。我们检查id(group1.mebers)和id(group2.members),可以发现他们是相同的
print(id(group1.members)) # 输出 140127132522040
print(id(group2.members)) # 输出 140127132522040
所以,group1.members和group2.members指向了同一个对象,对group2.members的修改也会影响group1.members。
那么问题来了,怎样修改代码才能解决上面默认参数的问题呢?
本篇要讲的是,连接字符串的时候可以用join也可以用+,但这两者有没有区别呢?
我们先来看一下用join和+连接字符串的例子
两者的结果是一样,那么考虑这样一个问题,这两者在性能上有区别吗?
我们来做个实验,比较下join和+的性能
作者:慧雅
链接:https://www.pythonheidong.com/blog/article/325/9ac3822a06116c317ff0/
来源:python黑洞网
任何形式的转载都请注明出处,如有侵权 一经发现 必将追究其法律责任
昵称:
评论内容:(最多支持255个字符)
---无人问津也好,技不如人也罢,你都要试着安静下来,去做自己该做的事,而不是让内心的烦躁、焦虑,坏掉你本来就不多的热情和定力
Copyright © 2018-2021 python黑洞网 All Rights Reserved 版权所有,并保留所有权利。 京ICP备18063182号-1
投诉与举报,广告合作请联系vgs_info@163.com或QQ3083709327
免责声明:网站文章均由用户上传,仅供读者学习交流使用,禁止用做商业用途。若文章涉及色情,反动,侵权等违法信息,请向我们举报,一经核实我们会立即删除!