當前位置:
首頁 > 新聞 > IBM新研究登上Nature封面:兩種量子演算法解決分類問題

IBM新研究登上Nature封面:兩種量子演算法解決分類問題

機器學習核方法在模式識別中廣泛使用,但當特徵空間變大時,核函數計算成本高昂,普通計算機難以負擔。量子計算機可以在極大的空間中展開計算,如果將數據映射到只存在量子態的空間中會怎麼樣呢?在 Nature 今天發表的一篇論文中,IBM 的研究者提出將量子態空間作為特徵空間來使用。他們提出了兩種基於超導處理器的量子演算法用於解決分類問題,並進行了大量實驗。

IBM新研究登上Nature封面:兩種量子演算法解決分類問題

打開今日頭條,查看更多圖片

機器學習和量子計算在技術炒作方面都達到了驚人的程度,除此之外,二者數學基礎的某些方面也有著驚人的相似性。今天 Nature 發表了一篇論文《Supervised learning with quantum-enhanced feature spaces》(Havlí?ek 等人),研究者探索了二者的聯繫,展示了如今的量子計算機理論上可以怎樣的方式從數據中學習。他們給出的方法是:將數據映射到只存在量子態的空間里。

量子計算機很難在台式電腦等經典計算機上進行模擬,這是人們對量子計算機的初步認識之一。換句話說,經典計算機無法用於獲取量子計算結果,因為這一過程需要大量數字來描述計算的每個內部步驟。回憶一下我們在學校學的大數除法的多個步驟。如果這是在經典計算機上模擬的量子計算,那麼每個中間步驟都需要更多的數字來描述它,這個數字比宇宙中已知的原子數還要大。

用一組數字描述的量子系統狀態被稱為量子態。如果一個量子態與許多值相關,我們就說其「生活在」一個很大的空間中。對於基於連續變數的量子計算機來說,這些空間甚至可能無限大。

相比較而言,機器學習分析的數據所處的空間要小得多,也就是說,描述數據的值要少得多。例如,一張 100 萬像素的圖像只需要 300 萬個數字來描述所有像素點裡的紅、綠、藍值。機器學習的一個典型任務是判斷圖像里的內容,或生成相似的圖像。然而,機器學習中一個叫作「核方法」(kernel method)的成熟理論處理數據的方式與量子理論處理數據的方式類似。

簡而言之,核方法通過定義哪些數據點彼此相似、哪些不相似來開展機器學習。從數學上來講,相似性就是數據空間中的一段距離,即數據點數字表徵之間的距離。相似的圖像被認為擁有相似的內容,機器學習中數據點之間的距離非常重要。但定義相似性並沒有聽上去那麼簡單。例如,如果根據每張圖像里的紅色值來判斷,那麼兩張圖像在數據空間中的距離是什麼?

核理論表明,許多關於數據空間相似性的定義在數學上等價於一個更大、可能是無限大的空間中對相似性的簡單度量(見圖 1)。因此,每次比較兩張圖像的時候,都要將圖像隱式地映射到一個大空間的表徵,然後簡單地計算相似性。普通計算機無法顯式地計算這種大型表徵,但也許量子計算機存在這種可能性?量子計算機可以在極大的空間中展開計算,如果將數據映射到只存在量子態的空間中會怎麼樣呢?

IBM新研究登上Nature封面:兩種量子演算法解決分類問題

圖 1:量子增強機器學習。Havlí?ek 等人展示了量子計算機如何提升機器學習演算法的性能。在這個簡單的圖示中,常規(經典)計算機將機器學慣用於動物圖像分類。圖像的像素顏色相似,則在數據空間中彼此靠近。經典計算機將這些數據發送至量子計算機,後者將每一幅圖像映射到量子空間中的特定量子態。數據空間中彼此靠近但內容不同的圖像由量子空間中相距甚遠的量子態來表示。量子計算機將量子態之間的距離發送至經典計算機,以提升圖像分類效果。

幾乎是在同一時間,Havlí?ek 等人和 Maria Schuld 的研究團隊意識到機器學習和量子計算之間可能存在密切聯繫。值得注意的是,兩個團隊提出了本質相同的兩種策略,即設計用於機器學習的量子演算法。第一種策略僅能實現量子計算機的最小使用,將其作為常規機器學習系統的硬體補充:當給定兩個數據點時,量子設備返回相似性。第二種策略是在量子計算機上執行實際學習,經典計算機作為輔助。

Havlí?ek 等人的一項關鍵貢獻是,他們在原理驗證試驗中基於真實的量子計算機(IBM 的量子計算機)實現了這兩種策略。儘管一些新聞報道有些誇張,但任何嘗試過量子計算的人都知道從這些設備中收集有意義的數據是非常困難的,因為量子計算中存在大量實驗雜訊。這可能也是他們在實驗中僅使用了量子裸機的原因,在一些人看來這已經足夠多了。量子空間僅有四個維度,因為該設置使用了 IBM 最小的 5 量子比特計算機的兩個量子比特(qubit),而目前 IBM 雲服務已經能夠提供 20 量子比特設備。數據集也經過類似的手工處理,使其在四維量子空間中易於分析。

然而,Havlí?ek 及其同事的研究展示了一種有趣的原理驗證試驗——使用量子計算機進行機器學習,這說不定是一種變革性方法。現在已有很多研究進行了大量嘗試,試圖將更流行的人工神經網路與量子計算結合起來,核方法為機器學習和量子理論提供了一座很自然的橋樑。但是,意識到這座橋的存在還只是開始。

例如,Havlí?ek 等人在量子空間中表示數據的方式是否可用於現實世界的機器學習應用,這仍待觀察。也就是說,我們不知道這種方法是否與有意義的相似性方法相關,比如在動物圖像分類時,將貓的圖像放得近一些,而不是將貓圖像放在狗圖像旁邊。此外,我們不清楚是否存在其他更好的策略。這些技術是否已經足夠好,可以打敗有將近 30 年歷史的經典方法?如果答案是肯定的,那麼尋找量子計算機「殺手級應用」的行動可以告一段落了。然而,這個問題的答案可能要複雜得多。

論文:Supervised learning with quantum-enhanced feature spaces

IBM新研究登上Nature封面:兩種量子演算法解決分類問題

文章鏈接:https://www.nature.com/articles/s41586-019-0980-2

摘要:機器學習和量子計算這兩種技術均具備改變計算方式的潛力,以解決之前的難題。機器學習核方法在模式識別中廣泛使用,例如支持向量機(SVM)是處理分類問題的最著名方法。然而,這一成功解決方案也存在局限,當特徵空間變大時,SVM 核函數計算成本高昂,難以估計。量子演算法中計算加速的核心元素是通過可控的糾纏和干預利用巨大的量子態空間。本研究中,我們提出了兩種基於超導處理器的量子演算法,並進行了大量實驗。這兩種方法的核心要素是將量子態空間作為特徵空間來使用。使用經過量子增強的特徵空間(僅能夠在量子計算機上高效獲取)提供了一種可能的路徑,導向量子優勢。這兩種演算法可解決監督學習問題:分類器的構建。其中一種方法是量子變分分類器,它使用變分量子電路(variational quantum circuit)對數據進行分類,運作方式與常規 SVM 很類似。另一種方法是量子核估計(quantum kernel estimator),它使用量子計算機估計核函數,並優化經典 SVM。這兩種方法為探索將帶雜訊的中間尺度量子計算機應用到機器學習提供了工具。

量子變分分類器

量子變分分類器使用變分量子電路實現,量子電路包含三部分:特徵圖編碼、變分優化和度量。

IBM新研究登上Nature封面:兩種量子演算法解決分類問題

量子變分分類器圖示。

IBM新研究登上Nature封面:兩種量子演算法解決分類問題

IBM新研究登上Nature封面:兩種量子演算法解決分類問題

IBM新研究登上Nature封面:兩種量子演算法解決分類問題

特徵圖編碼

IBM新研究登上Nature封面:兩種量子演算法解決分類問題

變分優化

量子核估計

IBM新研究登上Nature封面:兩種量子演算法解決分類問題

IBM新研究登上Nature封面:兩種量子演算法解決分類問題

量子核函數

IBM新研究登上Nature封面:兩種量子演算法解決分類問題

實驗實現

IBM新研究登上Nature封面:兩種量子演算法解決分類問題

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 機器之心 的精彩文章:

百倍利潤封頂:OpenAI宣布轉型為營利公司,Sam Altman任CEO

TAG:機器之心 |