Web开发面试的那些题-算法篇
Web 开发者面试题集第三篇,关于计算机网络。
秋招提前批已经基本结束了,即将进入金九银十,正式的号角已经打响。春招,以及秋招提前批一路过来,断断续续也面了一些公司,自己在笔记上也有总结,甚至自己进行过一些猜题。发现基本问到的问题八九不离十,但是有些知识,特别是偏工程的知识点,如果没遇到过,很难产生深刻的印象。结合自己之前的笔记,也想在正式进入 9 月之前,整理一个面试题集系列,加深理解。
这是这个系列的第三篇,关于算法。
前端开发者的算法知识是一直被诟病的一点,因为前端开发并不需要掌握太多算法知识。其实很多开发都不需要太多的算法知识,所以这里总结的也是一些基础的算法,或者被问过,或者我觉得挺有意思需要掌握。高阶一点的算法,如果我研究过,也觉得有意思,会发表在算法的大分类下。
现在各领域更新换代很快,很多工作并不需要太多思考。高中以来这么久,虽然学到的知识多了,但自我感觉自己的逻辑思维并没有得到太大的提高。算法其实算是工作之余额外的调剂,动动脑,思考思考,挺好。
这一领域难免有很多疏漏的地方,因为自己也是算法菜鸟,欢迎指正。
1 排序算法
排序算法可以说是被考到最多的算法系列了,结合着之前自己学习数据结构课程的笔记,以及看过浙大的数据结构课程 (推荐有时间的一定要去看看,因为讲的真的太棒了),下面给出一些排序算法的伪码或者是自己写的 JavaScript 版本
1.1 选择排序
选择排序可以说是最好理解的排序了,就是每次从未排数组里找到一个最小的数与数组第一个数做交换即可
1.1.1 时空复杂度分析
- 额外空间复杂度:$O(1)$。因为只需要一个临时变量存最小的数
- 时间复杂度:$O(N^{2})$
- 比较复杂度:$O(N^{2})$。第一次需要(n-1)次比较…第 N 次需要 0 次比较,一共 $\frac{N\times (N-1)}{2}$ 次
- 交换复杂度:$O(N)$
- 最坏情况:每次都需要交换,一共交换$N-1$次
- 最好情况:已排好序,每次无需交换,$0$次
- 平均情况:$\frac {N-1}{2}$次
|
|
1.2 插入排序
插入排序则类似于我们玩扑克牌游戏时,抽到一张牌,从后往前比较,找到合适位置进行插入
1.2.1 时空复杂度分析
- 额外空间复杂度:$O(1)$。只需要一个临时变量存当前待插入的数
- 时间复杂度:$O(N^2)$
- 比较复杂度:$O(N^2)$
- 最坏情况:每次都要比较到第一个元素,第一次比较 1 次,第 N-1 次比较 N-1 次,一共$\frac {N\times (N-1)} {2}$次
- 最好情况:完全排好序,每次只需与前一个元素比较,一共比较$N-1$次
- 平均情况:每次平均比较到中间位置,一共$\frac {N\times (N-1)} {4}$次
- 交换复杂度:$O(N^2)$
- 最坏情况:每次比较完都需要交换,一共$\frac {N\times (N-1)} {2}$次
- 最好情况:完全排好序,交换$0$次
- 平均情况:每次比较到中间进行交换,一共$\frac {N\times (N-1)} {4}$次
- 比较复杂度:$O(N^2)$
|
|
1.3 扩展:插入排序和选择排序的比较
1.3.1 时间复杂度分析
让我们再来看看插排和选排的时间复杂度,相信大多数人考虑到的都是比较复杂度作为其总体复杂度。我开始就只考虑这个,但是交换复杂度确实也是存在的,分析起来,还有那么点意思
1.3.2 选择排序
- 时间复杂度:$O(N^{2})$
- 比较复杂度:$O(N^{2})$。第一次需要(n-1)次比较…第 N 次需要 0 次比较,一共 $\frac{N\times (N-1)}{2}$ 次
- 交换复杂度:$O(N)$
- 最坏情况:每次都需要交换,一共交换$N-1$次
- 最好情况:已排好序,每次无需交换,$0$次
- 平均情况:$\frac {N-1}{2}$次
1.3.3 插入排序
- 时间复杂度:$O(N^2)$
- 比较复杂度:$O(N^2)$
- 最坏情况:每次都要比较到第一个元素,第一次比较 1 次,第 N-1 次比较 N-1 次,一共$\frac {N\times (N-1)} {2}$次
- 最好情况:完全排好序,每次只需与前一个元素比较,一共比较$N-1$次
- 平均情况:每次平均比较到中间位置,一共$\frac {N\times (N-1)} {4}$次
- 交换复杂度:$O(N^2)$
- 最坏情况:每次比较完都需要交换,一共$\frac {N\times (N-1)} {2}$次
- 最好情况:完全排好序,交换$0$次
- 平均情况:每次比较到中间进行交换,一共$\frac {N\times (N-1)} {4}$次
- 比较复杂度:$O(N^2)$
1.3.4 复杂度的几种情况
虽然上面提到了平均情况,但是我们在考虑一个算法时,往往需要考虑其边界,也就是考虑其最坏情况,这样有助于我们对其性能的分析,因此下面以最坏情况进行一个分析
仔细看的话,会发现对于比较复杂度,选排是固定的,为 $\frac{N\times (N-1)}{2}$ 次,而插排最坏达到$\frac {N\times (N-1)} {2}$次;而对于交换复杂度,选排最坏$N-1$次,插排最坏$\frac {N\times (N-1)} {2}$次。其实单单从 N 的量级上来看,选排似乎更优,但真的是这样吗?
算法导论上提到一个排序算法的性能依赖于以下因素
- 待排项数
- 这些项已排序程度
- 项值的限制
- 计算机体系结构
- 使用的存储设备种类(主存,磁盘或磁带)
我们假设对比基于同一计算机体系结构,存储设备也一样,项值无限制。只要制约因素为待排项数和已排序程度
对于已排序程度来说,如果排序程度较大,比较复杂度中插排很难达到最坏情况,此时其实比较次数是很少的;如果 N 很大时,差异也将显著增大,而插排的交换复杂度是和比较复杂度呈正相关的,此时插排的交换复杂度也会降低。这样来说插排还是由于选排的,因为选排时间复杂度固定,而插排会随着排序程度发生变化
查了一些资料,里面都提到上面这种说法,但是却没有对交换开销和比较开销做一个深层次的剖析,直到我在知乎上看到这位答主的一个深层次解析
其实我们没怎么考虑交换,是因为交换开销确实没有比较开销大,交换一般直接交换内存地址而不是直接交换真实的数据,而比较则需要 CPU 的一些运算。上面答主便给出了自定义赋值函数,如果直接交换数据,增大开销之后,当数据量过大,插入排序反而不如选择排序,因为其交换次数平均情况下和选择排序仍然不是一个量级
其实我在 quora 上还看到一个有趣的回答,什么时候该避免使用插入排序呢?
插入排序交换次数多,交换需要写内存,所以使用 Flash Memory 时,应该减少写操作,因为 Flash Memory 的擦除次数有限,也就是重新写入次数有限。所以应该避免在 Flash Memory 上使用插入排序
1.3.5 参考
1.4 冒泡排序
冒泡排序也比较好理解,这里为了形象比喻,数组的从前往后相当于大海的由浅至深
从后往前比较,如果该数比前一个数小,就交换,否则不换,下一个数又和再下一个数继续比较,小数(小泡泡)往前(往上冒),一轮下来,最小的泡泡已经冒到最顶上了
下面使用的是改进的冒泡,也就是说如果一轮比较下来,没有发生一次交换,说明所有泡泡都在自己正确的位置上,也就是排序已完成,无需再进行下一轮冒泡了
|
|
1.5 归并排序
递归排序使用的是分治思想
首先是分的过程,将其分成左右两个部分,分别递归(这叫做归)
最后是治的过程,将左右两个部分合并(这叫做并)
归并需要额外的空间复杂度,因为我们需要临时存放归并好的部分,存放完成之后还要将其覆盖原数组的相同位置,因此需要额外$O(N)$的空间
对于时间复杂度而言,归并的复杂度等于递归左边的复杂度加上递归右边的复杂度,最后加上合并的复杂度,由于合并时 N 个元素都需要进行比较,所以也可以用递推方程组求解
$$ T(n)=\begin{cases} O(1) &n=1 \\ 2T(\frac n 2)+O(n) &n>1 \end{cases} $$
这种递推公式可以用数学递推求解得到 $T(n)=O(n\times \log n)$
归并时需要知道待归并左部分起始位置和右半部分结束位置
|
|
1.6 快速排序
快速排序分为 3 个过程
- 寻找主元(我这里直接使用中间数法,即取待排数组的前中后元素的中位数)
- 将主元交换到正确的位置上
- 递归排序主元的左半部分和右半部分
1.6.1 快速排序快在哪儿
我们算法导论课的老师曾说过
快速排序快就快在"不捣腾内存"
我最初理解的捣腾内存,是只包括交换操作的,直到对选择排序和插入排序进行系统分析,才认为这里的捣腾内存还应该包括比较操作
最开始理解快排的快,是因为其主元排好之后位置就不会再改变了,当时与插入排序作比较,因为插入排序插入了一个元素,可能其位置后面还会发生改变。这样的话,选择排序位置一旦选好也不变啊?其实关键点在于快排的主元选取逻辑
1.6.2 主元的选取
要知道,快排并不是所有情况下都快的,想要快,主元要选得好
在对于快速排序时间复杂度的分析上,我直接给出递推公式,不再详细分析其比较和交换复杂度,分析起来与选择排序和插入排序类似
如果我们每次选取的主元能够对待排序列进行一个二分,则有
$$ T(n)=\begin{cases} O(1) &n=1 \\ 2T(\frac n 2)+O(n) &n>1 \end{cases} $$
这种递推公式可以用数学递推求解得到 $T(n)=O(n\times \log n)$
那么,假设最糟糕的情况,我们每次选取的主元都是当前序列最大值(或最小值),无法进行二分,则有
$$ T(n)=\begin{cases} O(1) &n=1 \ T(n-1)+O(n) &n>1 \end{cases} $$
同样,使用数学递推可求解$T(n)=O(n^2)$
其实这种情况,可以理解为和选择排序一样,只不过选择排序是我们有意选择一个最小数,而这种排序则是我们无意中选到了最大数(或最小数),但是我们却还做了很多无用的比较,快排要避免这种情况
主元的选取上,由于我看的浙大 MOOC 上提到的是 Median of Three 的方法,所以我最开始以为这就是默认的,这种方法其实很难造成最糟糕情况,也是我们常用的方法
还有两种方法
- 直接选取第一个元素,这是最差劲的方法,特别是待排序列有序程度高的情况下,这种方法最容易造成最糟糕复杂度情况,因为第一个元素很可能是最小(或者最大)的元素
- 随机数法,这种方法也比较常见,而且也不容易造成最糟糕情况
主元选择逻辑对算法额外的性能影响
- 随机数法生成随机数的开销
- Median of Three 中增加了比较次数(前中后三个元素进行比较)
下面的代码我使用 Median of Three,同时为了提高性能,在 Median Three 中不仅仅选出中位数,而且对前中后三个数基于大小交换了位置,最后,将中位数放到最后一个数的前一个(也就是倒数第二个),方便比较
JavaScript 版本
|
|
2 全排列
全排列问题在笔试中出现过两三次,我这里想到的是最简单的递归方法
将字符串的每一个字符交换到第一个,再将其他部分全排列,使用第一个字符连接上后面全排列的所有可能字符串
时间复杂度分析
$$ T(n)=\begin{cases} O(1) &n=1 \\ n\times T(n-1) &n>1 \end{cases} $$
我们还是使用递推方程帮助我们思考并求解
$$ \begin {aligned} T(n)=n\times T(n-1)=n\times (n-1)\times …\times 2\times O(1)=n! \end {aligned} $$
|
|
上网查找之后,还发现一种利用字典顺序的解法,先举一个例子,看这个解法的操作过程,假设求字符串123
的全排列
起点:
123
,终点:321
,字典序的关键在于下一个排列基于前一个排列,且只比前一个排列大一点点。这个一点点的实现在于每次从倒数第二个元素开始,向后找比它刚好大一点的元素交换,交换之后,让该元素之后的部分元素升序排列,使得其排列刚好比前一个排列大一点点。如果向后找没找到,则从倒数第三个元素开始,以此类推。。。如果没懂,直接看下面一个例子。
123
中2
向后找比它大一点点的元素3
,交换为132
,并将3
之后部分元素升序排列,结果还是132
132
中3
向后没找到比它小的,则从1
开始向后找,找到比它刚好大一点点的元素2
,交换为231
,再将2
后面的部分元素升序排列为213
- …
- 最后到
321
,3
后面找不到比它更大的元素了,此时循环结束,算法完成
总结出算法的过程如下
- 对输入字符串先进行升序排列
- 升序序列作为起点
- 输入当前排列,根据当前排列计算出下一轮排列
- 从当前排列的倒数第二个元素开始向后找一个刚好比它大的元素交换,交换后将它之后的部分元素升序排列,此时得到下一轮序列,返回即可
- 上面一步如果找不到则从倒数第三个元素开始,重复上面一步,以此类推
- 如果走到了第一个元素还找不到,说明该排列到达终点,算法结束
|
|