在今天发表在《物理评论快报》(PRL)的论文《解决“悬铃木”量子线路的采样问题》(Solving the sampling problem of the Sycamore quantum circuits)中[1],中国科学院理论物理研究所张潘教授领导的团队成功打破了谷歌在2019年实现的“量子霸权”。

去年11月,该论文的预印版提交到arXiv时[2],光子盒对此进行了报道今天,值此论文正式发布之际,光子盒邀请张潘教授对该研究进行了深度解读。

张潘教授

01

第一次真正模拟谷歌量子线路

谈到最新论文的创新之处,就不得不先介绍其他三项重要研究,首先是张潘团队去年3月的arXiv论文[3],今年年初已发表在《物理评论快报》上[4],他们提出了一种新的大批振幅张量网络方法,可以将大量相关末态位串振幅的计算时间大大缩短。作者只使用了60块GPU在5天内即完成了200万相关样本振幅和概率的计算和100万相关样本的采样,线性交叉熵基准保真度XEB为0.739,大大高于谷歌0.002的结果,通过了谷歌的XEB测试。

然后是国家超级计算无锡中心在去年10月[5]和11月[6]的两篇论文,该团队在新一代神威超级计算机上开发了一个基于张量的高性能随机量子电路模拟器,使用超算实现了此类大量相关末态振幅的计算,将百万相关位串振幅的计算时间由5天缩短至了304秒。

这三项研究都有一个共同点,在模拟谷歌的量子随机线路采样时获得的都是相关样本,张潘介绍说,“上篇文章[4]我们所计算的是一个大空间中的一个子空间的严格信息,但谷歌的量子硬件得到的样本是无关的,意味着可以得到全空间的近似信息。如果只是相关的话,我们就得不到全空间的信息,只能得到一个子空间的信息,虽然它的线性交叉熵基准(XEB)保真度比较高,但并不能代表最后的保真度高,此时XEB无法代表保真度,这是子空间采样的最大问题。”

而在最新论文中,这个问题就被完全解决了,因为是无关样本,“计算的是整个空间的近似信息,谷歌的量子硬件采样和我们新的文章中一致,就是在整个空间中做近似采样。新算法获得的是保真度的信息,是完全和量子硬件一致的。”

近年来,挑战谷歌量子霸权的经典模拟方法几乎都采用张量网络,但在之前[7],想要获得无关样本,张量网络缩并需要被重复至少2000次,使得计算量太大,难以承受。

而这次[1],张潘带领博士生潘峰和硕士生陈珂旸提出了一种新的模拟方法,利用了“悬铃木”量子计算机所对应张量网络的空间结构和低秩结构,并结合新提出的稀疏态概念的张量网络缩并新方法,可以仅仅利用一次张量网络缩并完成大量无关位串的振幅计算,大大降低了获取不相关采样的计算复杂度。在实验中,张潘团队使用一个具有512块GPU的计算集群计算了15个小时,完成了53量子比特20循环的谷歌悬铃木量子霸权线路的采样任务,保真度约为0.0037,高于谷歌的保真度。

谷歌宣称他们的量子随机线路采样,用时大概200秒钟,得到百万个近似末态的位串采样,XEB保真度约为0.002。谷歌表示,这样一个采样问题用经典计算的角度去进行解决非常难,超级计算机需要计算10000年。

而张潘团队最新工作显示“不需要这么长时间,如果可以使用E级超算,只需要几十秒钟就可以解决这样一个随机量子线路的采样问题。当然我们真正的计算没有使用超算。我们是用了512块GPU算了15个小时,如果折合成E级超算的算力,几十秒就可以解决这个问题。”

02

如何完成模拟的?

目前,几乎所有对量子线路的经典模拟都采用了张量网络。

对此,张潘解释道,张量网络是高维线性代数,而量子力学就是线性代数。量子计算机现在常用的量子线路表示可以被认为是一种特殊的张量网络。“其实之前用的所有的对量子线路的经典模拟都可以认为是对张量网络的计算,比如全振幅模拟,它就是一种特殊的张量网络缩并顺序,从这个量子线路的初态缩并到量子线路的末态;用张量网络的语言来描述,就是从这个张量网络的一个边界,缩并到张量网络的另一个边界。所有量子线路模拟都可以从这个角度来进行阐述,这是等价的。”

在本次工作中,张潘团队将具有53个量子比特和20层循环的悬铃木量子电路转换为三维张量网络。的单次缩并会产生,i = 1, 2, … L,μ= 1, 2, … l,表示L(随机选择)个无关的位串组的振幅,每个组包含l个位串。

在模拟之前,他们首先简化张量网络,因为有许多缩并步骤可以预先进行,而不会干扰下面的过程。然后将张量网络分为两部分,头部和尾部,如下图所示。

将三维张量网络分为两部分

作者在的缩并中引入了6条局部切片边(不影响的缩并结果),空间和时间复杂度分别为230和2.3816 × 1013。缩并会产生一个大小为245的张量vhead,由于无法存储,他们枚举了vhead的16个条目,创建了216个张量网络缩并的子任务,每个子任务对应于16个二进制变量的配置。

在每个子任务中,vhead被分割成大小为229的张量,作为的边界。对于53量子比特和20层循环的悬铃木电路,设置L=220,l=26,即将位串组织为220个独立组,每个组包含26个位串。它充当了的另一个边界。在缩并时,他们引入了7条局部切片边,他们的稀疏态缩并方案的空间和时间复杂度分别为230和2.9425 × 1013。整个计算(用于完成216个子任务)的整体时间复杂度为3.489 × 1018,低于之前的工作。

为了提高GPU的效率,在缩并期间采用了分支合并策略。分支合并后,的GPU效率为31.76%,为14.27%,总体效率为18.85%。关于复杂性、估计保真度和GPU效率的详细数据列在下表中。

结果表明,他们使用Complex64作为缩并中的数据类型。的一个子任务缩并时间约为112秒,缩并时间约为315秒,完成一个子任务的总缩并时间为427秒。最终他们使用带有512个英伟达Tesla V100 GPU的计算集群,在大约15小时内完成了216个子任务的整个模拟。

谈到本次工作的进展,张潘表示,“我们用的张量网络方法有很多的进展,其中我们提出了新的稀疏态张量网络边界条件,可以获得一百万个无关的样本;其次,我们构造了新的张量网络数据结构用于存储稀疏张量;再者,我们发展了把稠密的张量和稀疏的张量进行缩并的方法、以及和它们适配的缩并顺序和切片方法。所以把所有的方法整合在一起,再加上我们提出的近似方法,比如对张量网络进行挖洞,然后对谷歌特殊的fSim两比特门进行低秩近似。所有方法结合在一起,才使得我们能够首次获得了保真度高于谷歌的一百万无关样本,才首次真正模拟了谷歌的悬铃木量子线路。

fSim门的低秩张量近似

03

经典和量子的竞争是一种良性发展

最近,Science也对这项工作进行了报道,在报道中,他们不仅采访了张潘教授,还采访了谷歌Quantum AI首席科学家Sergio Boixo,后者也承认了张潘团队的结论。不过谷歌也立了一个flag,他们说在2022年之后这种经典方法再也无法跟上量子线路的步伐。对此张潘表示,“我们也拭目以待,并在这个课题继续深入。”

谈到经典计算和量子计算的竞争,张潘表示,这是一种良性发展。

他说,在一个时期之内,量子计算和经典计算的竞争是不可避免的。“谷歌是初始的竞争,经典算法在之后获得了很大的进步,最终打败了它们的第一代硬件,之后肯定会有新的量子硬件出来打败新的经典算法,然后大家会进行迭代,当然这个时期有多长是个非常有意思的问题,我认为最终量子硬件会建立起来绝对优势,我也希望这一天能够尽早到来,这样的话量子计算机可以真正推动我们很多领域的进展,不光是量子计算,它会应用到其它的科学问题中去,比如困难的自旋玻璃统计物理问题等等。因此,我的看法是在一个时期内大家会相互竞争良性发展,最终量子计算会在特定问题上超出经典计算。”

张潘非常看好量子计算与经典计算的结合,“即使量子硬件能够在具体问题中展示出绝对的优越性,但是还是离不开经典算法,我们现在处在NISQ时代,比如我们要调节量子线路的参数进行学习,根据数据做具体分析,还是离不开经典算法,优化算法等等。因此我认为,即使以后我们能够在量子计算上展示出绝对的优势,也是在特定问题上展示。如果想要解决真正重要的实际问题,我们还是需要把量子计算和经典计算结合在一起,做到更好。”

张潘表示,“我们现在更感兴趣的问题是如何把量子硬件和张量网络经典方法结合在一起,解决具有挑战性的实际科学问题。”

参考文献:

[1]https://journals.aps.org/prl/abstract/10.1103/PhysRevLett.129.090502

[2]https://arxiv.org/abs/2111.03011

[3]https://arxiv.org/abs/2103.03074

[4]https://journals.aps.org/prl/abstract/10.1103/PhysRevLett.128.030501

[5]https://arxiv.org/abs/2110.14502

[6]https://arxiv.org/abs/2111.01066

[7]https://arxiv.org/abs/2005.06787

举报/反馈

光子盒

1692获赞 732粉丝
关注量子领域人和事。
关注
0
0
收藏
分享