经典4大Python面试题！看完考官竟然给了我30k的薪资

发布于2019-03-03 11:31 阅读(15331) 评论(0) 点赞(57) 收藏(16)

Python面试（一）之交换变量值

平时时不时会面面实习生，大多数的同学在学校里都已经掌握了Python。面试的时候要求同学们实现一个简单的函数，交换两个变量的值，大多数的同学给出的都是如下的答案

实际上，Python中还有更简洁的更具Python风格的实现，如下

相比前一种方法，后一种方法节省一个中间变量，在性能上也优于前一种方法。

我们从Python的字节码来深入分析一下原因。

dis是个反汇编工具，将Python代码翻译成字节码指令。这里的输出如下

通过字节码可以看到，swap1和swap2最大的区别在于，swap1中通过ROT_TWO交换栈顶的两个元素实现x和y值的互换，swap2中引入了tmp变量，多了一次LOAD_FAST, STORE_FAST的操作。执行一个ROT_TWO指令比执行一个LOAD_FAST+STORE_FAST的指令快，这也是为什么swap1比swap2性能更好的原因。

Python面试（二） is 和 == 的区别

面试实习生的时候，当问到 is 和 == 的区别时，很多同学都答不上来，搞不清两者什么时候返回一致，什么时候返回不一致。本文我们来看一下这两者的区别。

我们先来看几个例子：

上面的输出结果中为什么有的 is 和 == 的结果相同，有的不相同呢？我们来看下官方文档中对于 is 和 == 的解释。

官方文档中说 is 表示的是对象标示符（object identity），而 == 表示的是相等（equality）。is 的作用是用来检查对象的标示符是否一致，也就是比较两个对象在内存中的地址是否一样，而 == 是用来检查两个对象是否相等。

我们在检查 a is b 的时候，其实相当于检查 id(a) == id(b)。而检查 a == b 的时候，实际是调用了对象 a 的 __eq()__ 方法，a == b 相当于 a.__eq__(b)。

一般情况下，如果 a is b 返回True的话，即 a 和 b 指向同一块内存地址的话，a == b 也返回True，即 a 和 b 的值也相等。

好了，看明白上面的解释后，我们来看下前面的几个例子

打印出 id(a) 和 id(b) 后就很清楚了。只要 a 和 b 的值相等，a == b 就会返回True，而只有 id(a) 和 id(b) 相等时，a is b 才返回 True。

这里还有一个问题，为什么 a 和 b 都是 "hello" 的时候，a is b 返回True，而 a 和 b都是 "hello world" 的时候，a is b 返回False呢？

这是因为前一种情况下Python的字符串驻留机制起了作用。对于较小的字符串，为了提高系统性能Python会保留其值的一个副本，当创建新的字符串的时候直接指向该副本即可。所以 "hello" 在内存中只有一个副本，a 和 b 的 id 值相同，而 "hello world" 是长字符串，不驻留内存，Python中各自创建了对象来表示 a 和 b，所以他们的值相同但 id 值不同。

同学指出：intern机制和字符串长短无关，在交互模式下，每行字符串字面量都会申请一个新字符串，但是只含大小写字母、数字和下划线的会被intern，也就是维护了一张dict来使得这些字符串全局唯一）

总结一下，is 是检查两个对象是否指向同一块内存空间，而 == 是检查他们的值是否相等。可以看出，is 是比 == 更严格的检查，is 返回True表明这两个对象指向同一块内存，值也一定相同。

看到这里，大家是不是搞懂了 is 和 == 的区别呢？

那我们深入一步来思考一下下面这个问题：

Python里和None比较时，为什么是 is None 而不是 == None 呢？

欢迎回答在评论区~

Python面试（三）可变对象和不可变对象

上一个面试题：Python面试之 is 和 == 的区别的最后留了一个问题：

Python里和None比较时，为什么是 is None 而不是 == None 呢？

这是因为None在Python里是个单例对象，一个变量如果是None，它一定和None指向同一个内存地址。而 == None背后调用的是__eq__，而__eq__可以被重载，下面是一个 is not None但 == None的例子

好了，解答就到这里，我们开始本篇的正题。

Python中有可变对象和不可变对象之分。可变对象创建后可改变但地址不会改变，即变量指向的还是原来的变量；不可变对象创建之后便不能改变，如果改变则会指向一个新的对象。

Python中dict、list是可变对象，str、int、tuple、float是不可变对象。

来看一个字符串的例子

上面的例子里，修改a指向的对象的值会导致抛出异常。

执行 a = a + " world"时，先计算等号右边的表达式，生成一个新的对象赋值到变量a，因此a指向的对象发生了改变，id(a) 的值也与原先不同。

再来看一个列表的例子

上面对a修改元素、添加元素，变量a还是指向原来的对象。

将a赋值给b后，变量b和a都指向同一个对象，因此修改b的元素值也会影响a。

变量c是对b的切片操作的返回值，切片操作相当于浅拷贝，会生成一个新的对象，因此c指向的对象不再是b所指向的对象，对c的操作不会改变b的值。

理解了上面不可变对象和可变对象的区别后，我们再来看一个有趣的问题

明明group1和group2是不同的对象（id值不同），为什么调用group2的add_member方法会影响group1的members？

其中的奥妙就在于__init__函数的第二个参数是默认参数，默认参数的默认值在函数创建的时候就生成了，每次调用都是用了这个对象的缓存。我们检查id(group1.mebers)和id(group2.members)，可以发现他们是相同的

print(id(group1.members)) # 输出 140127132522040

print(id(group2.members)) # 输出 140127132522040

所以，group1.members和group2.members指向了同一个对象，对group2.members的修改也会影响group1.members。

那么问题来了，怎样修改代码才能解决上面默认参数的问题呢？

Python面试（四）连接字符串用join还是+

本篇要讲的是，连接字符串的时候可以用join也可以用+，但这两者有没有区别呢？

我们先来看一下用join和+连接字符串的例子

两者的结果是一样，那么考虑这样一个问题，这两者在性能上有区别吗？

我们来做个实验，比较下join和+的性能

上面的程序有如下的输出

join: 0.116944, plus: 0.394379

可以看到，join的性能明显好于+。这是为什么呢？

原因是这样的，上一篇Python面试之可变对象和不可变对象中讲过字符串是不可变对象，当用操作符+连接字符串的时候，每执行一次+都会申请一块新的内存，然后复制上一个+操作的结果和本次操作的右操作符到这块内存空间，因此用+连接字符串的时候会涉及好几次内存申请和复制。而join在连接字符串的时候，会先计算需要多大的内存存放结果，然后一次性申请所需内存并将字符串复制过去，这是为什么join的性能优于+的原因。所以在连接字符串数组的时候，我们应考虑优先使用join。