前言:二分简介
二分,是一种求极值的算法,通常已知答案的取值范围,然后每次取取值范围的中点,判断之是否可行,然后找可行的一半处理。 上面这段话比较难懂,那么我们举个栗子:
比如,我们要求使得革命能够成功的最低成本。
那么,此时这个成本的取值范围就是0~你所拥有的全部银子(假设为1000)。然后,我们取这个区间的中点(500),计算500块可不可以让革命成功,如果可以,那么我们下一步就要检查0~499元这个区间(因为500可以,那么比500元更多的钱必然可以),对0~499这个区间做同样处理的同时记录当前最优的500元。
如果500可以
反过来,如果500元不能让革命成功,那么0~499元更不可以,所以我们下一步就对501~1000这个区间做检查
如果500不行
最终,我们记录下的最优答案就是能让革命成功的最低成本
当然,二分要满足单调性:你用500块办不成,那么0~499块也办不成,你用500大洋办得成,那么501~inf大洋一定也办得成 一般是用l和r代表当前答案可能所在区间,然后每次取mid=(l+r)/2,判断mid是否可行,然后取l~mid-1区间或者mid+1~r区间
Part1:二分的中心思想
这是一个杯具,当你将二分的l+1<r写成l<r时,相信很多人都讨厌二分的边界,每次都弄不清楚二分的l和r要等于mid,还是mid-1,又或者是mid+1,这导致了很多人因此失分,那么,到底要怎么做才能区分二分的边界呢?
二分的思想主要分三种:
l和r代表的“成本值”均可行,且有一个ans变量记录当前的最优l和r代表的“成本值”均可行,最后的答案是l或rl代表的“成本值”可行,r不可行,最后的答案是l
下面我们将依次讲解1、2两种,第三种不推荐使用,比较容易出错
注:下面的全部模板都是求最小的满足指定条件的数(例如洛谷P2370)
Part2:写法一——记录答案法】
话不多说,先上模板:
首先,限制条件为l小于等于r,也就意味着结束需要l>r
第一步显然就是找区间中点
check(mid)是一个bool函数,返回mid是否可行,下面就是分情况讨论
mid可行,此时记录ans=mid,也就是mid是目前最优解,然后缩小查找范围:r=mid-1,寻找有没有更小的解
mid不可行,此时令l=mid+1,找更大的解来满足条件
也就是说,当mid可行,就记录mid,然后找有没有更优的,否则就退而求其次,牺牲数据的优秀度来满足条件
例如:要找出能够当飞行员的成绩最差的候选人,测试成绩居中的人,看他能不能胜任。
可以,记下他,然后对比他弱的人进行测试(ans=mid r=mid-1)不行,对比他强的人进行上述操作(l=mid+1)
Part3:写法二——不记录法
先上模板:
这里,当l==r时循环停止,此时无论输出l还是输出r都可以。取中点不讲。这里我们要保证l和r都是暂时可行的(没有证明不可行)的,所以**当mid被判定为可行时,r应该取到mid而不是mid-1,因为这里没有ans来记录,如果r取了mid-1,我们就永远丢失了mid这个可行解(mid永远取不到了),从而导致答案错误 **
如果mid不可行,仍然取l=mid+1,因为mid是不可行的,而我们要保证l可行
这里就是说,当mid可行,就在l~mid区间里面找(往小了找),否则就在mid+1~r来找,始终要保证l、r均可行且尽量靠近
**这里的重点:l和r都要暂时可行且l要极小,r要极大 **
前方高能,划重点:
**打个比方:一群选手按实力顺序排好,然后我们要找出能够AK IOI的实力最差的选手,那么我们选实力居中的那个,测试他能不能AK IOI:
可以(check(mid)=true)。那么实力比他更强的选手可以回去了,因为他们一定能AK IOI,而且实力比刚刚测试的那位要高。但是那个测试过的就可以“暂时安全”,因为他是目前最优解(能AK且实力最差),这一个操作就是r=mid不能(check(mid)=false)。那么他以及实力比他弱的全部淘汰,这个操作是l=mid+1 然后用新的区间不断重复即可
注:此处满足单调性,就是说如果X能AK IOI,那么比他强的也一定能,否则比他弱的一定不能**
再举个例子:
要找不能AK IOI的最强选手(注意,题设相反),那么照样按实力排好,测试居中的那个:
可以(check(mid)=false)。此时他以及比他更强的都不能符合要求(我们要找不能AK的,不是AKer),所以r=mid-1不能(check(mid)=true)。此时比他弱的人全部淘汰(比他弱的更不能,而且实力比他弱),这个操作是l=mid 之后就是对新的区间进行一样的操作
但是这个例子要注意一个特殊情况,如果l=2,r=3,mid=5/2=2,此时测试的check(mid)如果为true,那么l和r将永远卡在2和3,所以在此处,我们取的中点要靠右,也就是(l+r+1)/2,这样就能保证l和r不死循环
通过上述几个例子,应该能够比较直观的认识到这个不记录式的用法
Part4:二分查找
二分查找是利用二分的思想,在一个有序递增数列中查找某个值的算法。
例子:猜数游戏,老少咸宜,在1~100中想一个数key,然后让别人猜,每猜一次,就会告诉别人是大了还是小了。这个很经典了,先猜中间那个,然后如果大了就猜更小的,否则猜更大的,如果直接猜中就结束——与二分思想不谋而合
查找值为key的元素下标,不存在返回-1
首先我们看看模板
这里增加了一种情况,那就是a[mid]==key的情况,因为此处我们要精确地查找key,所以在发现a[mid]==key的时候立刻返回mid。 其它的情况都很好理解,如果偏大就在左半边找,否则在右半边找。 这个二分查找看上去很简单,但是,凶险的在后面。
查找大于等于/大于key的第一个元素
怎么样,似曾相识对不对?
**我们其实就是在找水平最差的能AK的人,只要把大于等于key第一个元素看做找水平最差的能AK的人,就很好理解了吧? 大于等于可以视为能够AK ** 。那么,我们按照之前讲到的,如果一个人可以AK(a[mid]>=key),那么比这个人强的人必然可以AK(对于所有i>mid,a[i]>=key),而且不会更优,所以不要,就让r=mid
如果这个人不可以AK(a[mid]<key),那么比他弱的更不行(对于所有i<mid,a[i]<key),就令l=mid+1
只要我们拿之前讲过的找AK的例子来类比一下,一下子就理解了
查找小于等于/小于key的最后一个元素
这里也是一个类比:就是上面讲过的,不能AK的最强选手,这里的“不能AK”指的是小于等于key。
这里,如果一个人可以AK(a[mid]>key,注意,没有等于,因为这里算的是小于等于),那么他和比他强的都不符合条件,此处是r=mid-1
如果他不能AK,那么留下他和比他水平更高的(l=mid)
总结一下,我们只需要把二分查找与之前的AK例子结合起来看,就不会写错边界了
Part5:二分答案例题——丢瓶盖(洛谷P1316)
简述:地上丢了A个瓶盖,为了简化问题,我们可以当作这A个瓶盖丢在一条直线上,现在要从这些瓶盖里找出B个,使得距离最近的2个距离最大
对应关系:
问题——不能AK的最强选手(可以选出B个瓶盖的最大距离)不能AK——可以选出B个瓶盖符合条件水平——最大距离如果居中的那个人不能AK(当前的距离限制可以选出B个瓶盖满足条件),那么令l=mid,留下他和水平更高的(往大了找)如果居中的那个人可以AK(当前的距离限制不允许选出B个瓶盖满足条件),那么令r=mid-1,留下水平更低的
只要能对应起来就很好理解了,下面是示例代码:
只要能找出对应关系,就一定能理解二分答案的精髓
结语
二分就是这样,维护一个当前可行区间,然后,尽量地取到更优,在当前值不可行的情况下牺牲优秀程度。诚心希望大家已经大概明白了二分的边界取值方法。
就像生活一样,在能够吃饱穿暖的情况下去旅行、去滑雪、去享受大自然、去为每一件小事感动……
本文发布于洛谷日报,特约作者:曦行夜落
原文地址:https://www.luogu.org/blog/tarjanfloydDP/qian-tan-er-fen-di-bian-jie-wen-ti