手记

量子深度学习:快速了解量子卷积神经网络

关于量子卷积神经网络(QCNNs)你需要知道的一切,包括这些方法相较于经典计算方法的优势和局限性

芬兰埃斯波的IQM量子计算机 by Ragsxl

近几年来,量子计算的投资显著增加,预计量子方法将在安全和网络通信等领域的应用彻底改变现有的经典计算技术。

如 Garg 和 Ramakrishnan 等研究人员所指出的,量子计算的核心在于“通过计算上更便宜的方法来解决经典计算机难以解决的问题”。这并不令人惊讶地,正如近年来深度学习和量子计算的研究共同发展,现在许多人正在探讨这两个领域交叉的可能性,即量子深度学习。

本文将从宏观层面讨论量子深度学习的现有研究和应用,重点关注混合量子卷积神经网络(QCNN)。首先,我们将简要介绍量子计算与经典计算的区别。然后,定义纠缠的概念、纠缠态及其应用。

接下来,我们将概述经典卷积神经网络(CCNNs,或简称CNNs)。最后,我们将讨论量子卷积神经网络(QCNNs)及其性能,以及这些方法的优点和局限性。

区分经典计算和量子计算

如果你完全不了解量子计算,一个重要的入门概念是经典计算(我们常见的计算方式)与量子计算之间的区别。量子计算是一种不同于传统计算的新计算方式。在经典计算机上,当一个程序被执行时,编译器会将程序的语句转换成对比特的操作,比特是0和1的单位。

与经典计算机中的比特不同,经典计算机的比特在任何时候只能是1或0。它们能够“处于悬停状态”在这两种状态之间。只有在测量时,它们才会“坍缩”成一个状态。

这种特性被称为叠加,在量子计算任务中至关重要(Ganguly, Cambier, 2021)。通过叠加,量子计算机可以同时执行任务,而不必依赖完全并行的架构或使用GPU来处理并行计算任务。这背后的原理是,因为每个叠加态代表不同的值,当对一个叠加态进行操作时,这个操作实际上会同时影响所有叠加态。

下面是一个量子叠加态的例子:

ab 表示概率振幅,它们给出了测量时投影到某个状态的概率。量子叠加态是通过使用量子逻辑门创建的。如果你对布拉-克特符号还不熟悉,强烈推荐佩里的《量子计算的庙宇》。

量子纠缠简介

正如叠加是量子物理中的一个重要原则,量子物理中的一个重要现象是量子纠缠。量子纠缠指的是通过某种方式使两个或多个粒子相互作用,从而无法独立描述它们的量子状态,即使它们相隔很远,也无法独立描述它们的量子状态。一旦粒子纠缠起来,如果测量其中一个粒子,那么另一个纠缠粒子的状态会瞬间显现出来,且正好相反(这些粒子之间没有局部关联性)。

纠缠态——贝尔态

注:贝尔态是量子物理中的一种特殊量子态。

在理解了量子比特和纠缠之后,我们现在可以来聊聊贝尔态了。这些是最为纠缠的量子比特状态。

|00⟩ 变为 β,即 (\frac{1}{\sqrt{2}}(|00\rangle + |11\rangle) = |\beta00\rangle)。

将量子态|01⟩ 变换为 β,其结果是 1除以根号2 (|01⟩ 加上 |10⟩),最终状态记为 β01⟩。这里,|01⟩ 和 |10⟩ 分别表示两个量子态。

|10⟩ → β → 1除以根号2 (|00⟩ − |11⟩) = |β10⟩

|11⟩ → β → ( \frac{1}{\sqrt{2}} ) (|01⟩ − |10⟩) = |β11⟩

贝尔态 (Bell 状态) 可以通过以下量子线路来创建:

贝尔态电路来自佩里在量子计算领域的殿堂。

这里展示了一个贝尔态生成电路,它接受量子比特,应用Hadamard门和CNOT门来创建一个纠缠的贝尔态。

虽然理解不同量子门的细节超出了本文的范围,但是鉴于旋转门和CNOT门将作为量子卷积神经网络(QCNNs)部分的一部分进行讨论,推荐查看以下指南

贝尔态已被用来开发一系列的量子计算应用。例如,Hegazy, Bahaa-Eldin 和 Dakroury 认为贝尔态和密集编码通信可以用来达到“无条件安全”

经典深度学习——卷积神经网络

在介绍了量子计算之后,我们将开始讨论经典深度学习,尤其是卷积神经网络(CNNs)。

如弗朗索瓦·科勒在《Python 深度学习》中提到,卷积神经网络(CNN)因其能够构建从线条到线条边缘的模式层次而受到欢迎,从而在层之间传递并利用信息,表示复杂的视觉信息。

CNNs 有卷积层,这些层由‘滑动’过输入的滤波器构成,从而生成一个“特征图”,用以检测输入中的模式。CNNs 还利用池化层来减小特征图的大小,从而减少学习资源的需求。更多关于这一点,强烈推荐 Oh, Choi 和 Kim 在 2020 年撰写的关于 CNN 的指南(点击这里查看)

Cecbur所示的卷积神经网络(CNN)

无量子卷积神经网络——一个混合网络的例子

回到我们的话题,经典CNN被定义之后,现在可以探索量子CNN如何利用这些传统方法并进行扩展。Garg 和 Ramakrishnan 指出,开发量子神经网络的一个常见方法是采用“混合”方法,引入所谓的“quanvolutional层(一种基于随机量子电路的变换)”,作为经典CNN中的一个附加组件。

在本节中,我们将讨论一种结合了经典电路与量子计算技术的混合QCNN,该混合QCNN由Lü等人开发,并在MNIST手写数字数据集上进行了测试。对于他们开发的混合QCNN,Lü等人在其2021年的论文中利用量子电路和纠缠作为经典模型的一部分来处理输入图像并输出预测结果。

在这种方法中,量子卷积神经网络(QCNN)将图像数据作为输入并将其编码成量子态 |x >,然后进行变换处理,并利用量子卷积和池化层提取特征(Lü等人,2021)。

最后,一个使用强纠缠电路的全连接层用来进行分类,并通过测量得到预测(Lü et al., 2021)。

优化过程,其目的是减少训练数据标签与QCNN预测标签之间的差异,通过随机梯度下降(SGD)方法来解决。在讨论量子电路时,量子卷积层中用到的门由旋转门和CNOT门的组合构成。

在池化层里,测量一部分量子比特,测量结果会决定是否对其邻居量子比特执行单比特门操作。

全连接层由“通用单量子比特量子门”和CNOT门构成,这些门可以产生纠缠状态。为了评估量子CNN相对于其他方法的表现,Lü等人使用了MNIST数据集,并模拟了一个量子CNN。按照常规做法,创建了训练和测试数据集,并开发了一个包含以下层的量子CNN模型。

  • 2, 量子卷积层
  • 2, 量子池化层
  • 1, 量子完全连接层

此QCNN在该数据集上达到了96.65%的测试准确率。相比之下,根据Papers with Code,使用经典CNN的最高准确率为99.91%。然而,值得注意的是,此次实验仅对MNIST数据集中的两类进行了分类,这意味着与其他MNIST模型的全面比较有些受限。

评估QCNNs的可行性

尽管像吕等人这样的研究人员已经开发了量子卷积神经网络(CNN)的方法,但该领域的一个关键挑战是实现理论模型所需的硬件尚未准备好使用(https://arxiv.org/pdf/2005.04316.pdf)。此外,混合方法也面临特定挑战,这些方法在经典计算中引入了quanvolutional层以配合CNN的使用

如果我们考虑量子计算的一个关键优势是它使得能够通过计算成本更低的技术解决“传统上难以解决的问题”,那么这些解决方案的一个重要方面是“量子提速”:当探讨量子机器学习的好处时,Phillipson(2020)提出,预计量子算法将比经典算法快得多,甚至是呈多项式或指数级别的加速。然而,Lü等人的方法在处理需要对经典数据进行一致解码/编码和测量的算法,比如QCNN时,“量子提速”的效果有限。Aaronson和Henderson等人在其各自的论文中都讨论了这一点。目前,关于如何设计编码/解码并尽量减少测量的协议,以更好地利用“量子提速”的效果,还缺乏足够的信息。

更广泛地说,纠缠已被证明是量子机器学习中的一个重要特性。Lü等人提出的量子卷积神经网络(QCNN)利用高度纠缠的电路,可以生成纠缠状态作为其全连接层,从而实现预测。纠缠也在其他地方被用于帮助深度学习模型,例如Liu等人使用纠缠来从图像中提取重要特征。此外,Sharma等人发现,利用纠缠的数据集可以使模型从比预期更小的训练数据集中学习,这进一步验证了所谓的“没有免费午餐”定理。

总结一下QCNN

本文比较了经典与量子深度学习方法,以及一种利用量子层(包括高度纠缠的电路)进行预测的QCNN(量子卷积神经网络)的概述。并探讨了量子深度学习的优势和局限性,以及纠缠在机器学习中的其他应用。

考虑到这一点,现在我们可以考虑量子深度学习的下一步,特别是 QCNNs。Garg 和 Ramakrishnan 指出,除了图像识别,量子方法也开始应用于诸如自然语言处理 (NLP) 这样的领域,例如 Galofaro 等人的工作,用于检测仇恨言论 (链接)。

我们还见证了量子硬件的进步,例如,PsiQuantum 正在开发百万量子位的量子处理器。尽管量子神经网络的应用遇到了一些挑战,但随着深度学习和量子计算领域研究的持续进行,我们有望在量子深度学习领域看到更多的进步。

相关资料

有兴趣的人可以参考这里提供的量子计算和深度学习的相关资源,以及文章中提供的链接,这里还包括了文章中的链接。

Aaronson, S. (2015). “细读条款”,自然物理学报,11(4),pp. 291–293. doi: 10.1038/nphys3272.

Biamonte, J. 等 (2017) “量子机器学习”,自然,549(7671). pp.195–202. doi: 10.1038/nature23474.

Chollet, F., (2021). 《Python深度学习》. 第二版. 纽约州谢尔特岛: Manning.

甘古利 S. 和 坎比亚 T.,2021。用Silq编程实现的量子计算。Packt出版社。

Garg, S. 和 Ramakrishnan, G. (2020) 量子深度学习进展综述, arXiv.org, 详见:https://arxiv.org/abs/2005

Hegazy, O., Bahaa-Eldin, A. 和 Dakroury, Y. (2014) 使用纠缠态和超密编码的量子安全直接通信,arXiv.org. 详见:https://arxiv.org/abs/1402.6219

Henderson, M. 等人,(2019) 基于量子电路的图像识别:量子卷积神经网络,arXiv.org. 网址:https://arxiv.org/abs/1904.04767

(Karn, 2016) 关于卷积神经网络的直观解释 — KDnuggets。网址为:https://www.kdnuggets.com/2016/11/intuitive-explanation-convolutional-neural-networks.html

刘 Y. 等, (2021) “基于张量网络机器学习的纠缠特征提取”,应用数学与统计学前沿, 7. 10.3389/fams.2021.716044.

吕 Y. 等., (2021) 一种用于图像分类的量子卷积神经网络, arXiv.org. 参见https://arxiv.org/abs/2107.03630.

梅塔(N.), 2020, 量子计算. [出版地不详]: 实用出版社.

Ofcom, (2021) 量子通信:未来通信的新潜力。网址: https://www.ofcom.org.uk/__data/assets/pdf_file/0013/222601/Executive-Summary.pdf

哦,S.,崔,J. 和金,J.(2020)量子卷积神经网络(QCNN)教程,arXiv网站。网址为: https://arxiv.org/abs/2009.09423

Pattanayak, S., (2021). 使用Python进行量子机器学习:使用Google的Cirq和IBM Qiskit. Apress一书.

菲利普森, F (2020). 量子机器学习:好处与实例. 获取地址为:http://ceur-ws.org/Vol-2561/paper5.pdf.

Perry, T. R. (2004). 量子计算的神殿:1.1 版 — 发布于 2006年 4月 29日

"Sewak 凯里姆,Pujari P. 实用卷积神经网络. 伯明翰: Packt. 2018."

Sharma, K. et al. (2022).__ “纠缠数据集上的免费午餐定理的重新表述”,物理评论 Letters,128(7). doi: 10.1103/physrevlett.128.070501.

Voorhoede, D. (2022.) 叠加与纠缠,量子激励。网址 available at: https://www.quantum-inspire.com/kbase/superposition-and-entanglement/

0人推荐
随时随地看视频
慕课网APP