Python后端工程师面试题(附答案)终结版

之前在网上搜集python面试题,这是最流行的一个版本。但是没有答案,故自己搜集或回答了一部分。现分享给大家,有些题目

回答的并不准确,望各路大神纠正,完善!!!

python语法以及其他基础部分

1.可变与不可变类型;

不可变类型(数字、字符串、元组、不可变集合)不可变类型不能被修改。 可变类型(列表、字典、可变集合)

2.浅拷贝与深拷贝的实现方式、区别;deepcopy如果你来设计,如何实现;

  • 基本类型 : 基本类型在内存中分别占有固定大小的空间,他们的值保存在栈空间,我们是通过按值来访问的。
  • 引用类型 : 栈内存中存放的只是该对象的访问地址,在堆内存中为这个值分配空间。由于这种值的大小不固定, 因此不能把它们保存到栈内存中。但内存地址大小的固定的,因此可以将内存地址保存在栈内存中。 这样,当查询引用类型的变量时, 先从栈中读取内存地址, 然后再通过地址找到堆中的值。对于这种, 我们把它叫做按引用访问。

浅拷贝只复制指向某个对象的引用地址,而不复制对象本身(只复制一层对象的属性),新旧对象还是共享同一块内存。 但深拷贝会另外创造一个一模一样的对象,新对象跟原对象不共享内存,修改新对象不会改到原对象。 浅复制只复制一层对象的属性,而深复制则递归复制了所有层级。

import copy as cp
L=[1,[2,3]]
L1=cp.copy(L) #浅拷贝: 只是引用,并不会开辟新的内存空间,
                                             L1与L指向同一片内存空间。L改变,L1也会锁着改变。
L2=cp.deepcopy(L) #深拷贝:会为数据重新开辟一片内存空间,L的变化不会影响L2。

3.new() 与 init()的区别;

new_作用于_init_之前。前者可以决定是否调用后者,或者说可以决定调用哪个类的_init_方法。 首先要知道在面向对象编程中,实例化基本遵循创建实例对象、初始化实例对象、最后返回实例对象这么一个过程。 Python 中的 _new 方法负责创建一个实例对象,init 方法负责将该实例对象进行初始化;

4.你知道几种设计模式;

单例模式:保证一个类仅有一个实例,并提供一个访问他的全局访问点,例如框架中的数据库连接 装饰器模式:不修改元类代码和继承的情况下动态扩展类的功能,例如框架中的每个controller文件会提供before和after方法。 迭代器模式: 提供一个方法顺序访问一个聚合对象中各个元素,在PHP中将继承 Iterator 类 命令模式: 将”请求”封闭成对象, 以便使用不同的请求,队列或者日志来参数化其他对象. 命令模式也支持可撤销的操作.

5.编码和解码你了解过么;

数据通过编码decode转换成Unicode编码,编码的同时会将数据变成byte类型,通过解码encode转换为utf-8。

6.列表推导list comprehension和生成器的优劣;

[expr for iter_var in iterable] 列表推导式是将所有的值一次性加载到内存中 (expr for iter_var in iterable) 在大数据量处理时,生成器表达式的优势就体现出来了,因为它的内存使用方式更好, 效率更高,它并不创建一个列表,只是返回一个生成器。

7.什么是装饰器;如果想在函数之后进行装饰,应该怎么做;

装饰器是一个函数,这个函数的主要作用是包装另一个函数或类 包装的目的是在不改变原函数名的情况下改变被包装对象的行为。 接收一个函数,内部对其包装,然后返回一个新函数,这样子动态的增强函数功能 通过高阶函数传递函数参数,新函数添加旧函数的需求,然后执行旧函数。

8.手写个使用装饰器实现的单例模式;

该模式的主要目的是确保某一个类只有一个实例存在。

from functools import warps
def My_decorate(f):
    @warps(f)
    def fn(*args,**kwargs):
        print('decorate called')
        return f(*args,**kwargs)
    return fn
@My_decorate
def fx():
    pring('fx called')
fx()

9.使用装饰器的单例和使用其他方法的单例,在后续使用中,有何区别;

使用装饰器单例属性不会被覆盖。因为装饰器单例模式是直接返回之前生成的对象, 并不会重新初始化对象。像new方法构建的单例模式会重新调用init方法,为实例重新初始化属性。

10.手写:正则邮箱地址;

pattern = '[a-zA-Z0-9_.-]+@[a-zA-Z0-9]+\.[a-z]'  

匹配身份证:

pattern = '(^\d{15}$)|(^\d{18}$)|(^\d{17}(\d|X|x)$)'
pattern = '^[1-9]\d{5}(18|19|([23]\d))\d{2}((0[1-9])|(10|11|12))(([0-2][1-9])|10|20|30|31)\d{3}[0-9Xx]$'

11.介绍下垃圾回收:引用计数/分代回收/孤立引用环;

垃圾回收:python解释器对正在使用的对象保持计数,当某个对像的引用计数降为0时,垃圾收集器就可以释放 该对象,获取分配的内存。当分配对象和取消分配对象的差值高于阈值时垃圾回收才会启动。 分代回收:python将所有的对象分为0,1,2三代。所有的新建对象都是0代对象。当某一代对象经历过垃圾回收, 依然存活,那么它就被归入下一代对象。垃圾回收启动时,一定会扫描所有的0代对象。 如果0代经过一定次数垃圾回收,那么就启动对0代和1代的扫描清理。 当1代也经历了一定次数的垃圾回收后,那么会启动对0,1,2,即对所有对象进行扫描。 孤立引用环:

12.多进程与多线程的区别;CPU密集型适合用什么;

多线程:在单个程序中同时运行多个线程完成不同的工作,称为多线程。 线程共享内存空间;进程的内存是独立的, 同一个进程的线程之间可以直接交流;两个进程想通信,必须通过一个中间代理来实现, 一个线程可以控制和操作同一进程里的其他线程;但是进程只能操作子进程 优缺点:1.多进程的优点是稳定性好,一个子进程崩溃了,不会影响主进程以及其余进程。 但是缺点是创建进程的代价非常大,因为操作系统要给每个进程分配固定的资源。 2.多线程优点是效率较高一些,但是致命的缺点是任何一个线程崩溃都可能 造成整个进程的崩溃,因为它们共享了进程的内存资源池。 *CPU密集型适合用多进程开发

13.进程通信的方式有几种;

进程间通信主要包括管道, 系统IPC(包括消息队列,信号量,共享存储), SOCKET

14.介绍下协程,为何比线程还快;

高并发+高扩展性+低成本:一个CPU支持上万的协程都不是问题。所以很适合用于高并发处理 协程能保留上一次调用时的状态,管是进程还是线程,每次阻塞、切换都需要陷入系统调用, 使用线程时需要非常小心地处理同步问题,而协程完全不存在这个问题。

15.range和xrange的区别

xrange和range 的用法完全相同,但是返回的是一个生成器。

算法排序部分

16.手写快排;堆排;几种常用排序的算法复杂度是多少;快排平均复杂度多少,最坏情况如何优化;

17.手写:已知一个长度n的无序列表,元素均是数字,要求把所有间隔为d的组合找出来,你写的解法算法复杂度多少;

def func(x, d):
    L = []
    n = len(x)
    if d > n:
        return None
    L.append(x[0])
    a = d + 1
    while a < n:
        L.append(x[a])
        a = a + d + 1
    return L

list = [x for x in range(100)]
result = func(list, 10)
print(result)

我写的只考虑到从第一个元素开始组合。没有考虑从第二个,第三个元素开始......求大神提供完全正确方法。

18.手写:一个列表A=[A1,A2,…,An],要求把列表中所有的组合情况打印出来;

19.手写:用一行python写出1+2+3+…+10**8 ;

s = sum([x for x in range(1,10**8+1)])

20.手写python:用递归的方式判断字符串是否为回文;

def isHuiWen(str):
    if(len(str) <2):
        return True
    if str[0] !=str[-1]:
        return False
    return isHuiWen(str[1:-1])

str = input("请输入一个字符串:")
if isHuiWen(str):
    print("该字符串为回文字符串")
else:
    print("该字符串不是回文")

21.单向链表长度未知,如何判断其中是否有环;

22.单向链表如何使用快速排序算法进行排序;

23.手写:一个长度n的无序数字元素列表,如何求中位数,如何尽快的估算中位数,

你的算法复杂度是多少;

def func(list):
if len(list) <= 1:
    return list
L = sorted(list)
n = len(list) % 2
m = len(list) // 2
if n == 0:
    s = (L[m] + L[m-1]) / 2
    return s
s = L[m]
return s

l = [1,2,6,84,12,62,100]
print(func(l))

24.如何遍历一个内部未知的文件夹(两种树的优先遍历方式)

网络基础部分

25.TCP/IP分别在模型的哪一层;

TCP 在传输层, IP在网络层

26.socket长连接是什么意思;

在一个TCP连接上可以连续发送多个数据包,在TCP连接保持期间,如果没有数据包发送, 需要双方发检测包以维持此链接,一般需要自己做在线维持。 长连接指建立SOCKET连接后不管是否使用都保持连接,但安全性较差 数据库的连接用长连接。如果用短连接频繁的通信会造成socket错误, 而且频繁的socket创建也是对资源的浪费

27.select和epoll你了解么,区别在哪;

28.TCP UDP区别;三次握手四次挥手讲一下;

TCP协议: (在传输之前先建立连接)面向连接(的通信服务):可靠地数据传输,失序,无差错,无丢失,无重复 用途:适用于传输内容比较大,网络情况比较好,需要提供准确的情况.比如:聊天信息,文字传输,邮件传输。 udp 协议:面向无连接的服务,不可靠,发送时由发送端自主进行,不考虑接收端。 用途:适用于网络较差,对传输准确性要求低,广播组播.比如:视频会议,广播数据。

  • 三次握手:

1.客户端向服务器发起链接请求(问是否可以连接) 2.服务器接受到请求后进行确认(允许连接)返回报文 3.客户端收到许可,建立连接

  • 四次挥手:

1.主动方发送报文告知被动方要断开连接 2.被动发返回报文没告知收到请求,准备断开 3.被动发发送报文给主动方告知准备就绪可以断开 4.主动方发送报文确定断开

29.TIME_WAIT过多是因为什么;

30.http一次连接的全过程:你来说下从用户发起request——到用户接收到response;

域名解析 --> 发起TCP的3次握手 --> 建立TCP连接后发起http请求 --> 服务器响应http请求, 浏览器得到html代码 --> 浏览器解析html代码,并请求html代码中的资源(如js、css、图片等) --> 浏览器对页面进行渲染呈现给用户. 参考大神文章:https://www.cnblogs.com/engeng/articles/5959335.html

31.http连接方式。get和post的区别,你还了解其他的方式么;

get是从服务器上获取数据,post是向服务器传送数据。在客户端, get方式在通过URL提交数据, 数据在URL中可以看到;post方式,数据放置在HTML HEADER内提交。 对于get方式,服务器端用Request.QueryString获取变量的值, 对于post方式,服务器端用Request.Form获取提交的数据。 Get 方式提交数据,会带来安全问题,比如一个登陆页面,通过 Get 方式提交数据时, 用户名和密码将出现在 URL 上,如果页面可以被缓存或者其他人可以访问客户这台机器, 就可以从历史记录获得该用户的帐号和密码,所以表单提交建议使用 Post 方法。

32.restful你知道么;

33.状态码你知道多少,比如200/403/404/504等等;

  • 200:操作成功。
  • 403:访问受限,授权过期(错误提示)
  • 404:资源,服务器未找到
  • 504:网关超时,服务器作为网关或代理,但是没有及时从上游服务器收到请求。