Nature：量子計算機成功實現監督式機器學習，「殺手級應用」就要來了？

新聞 03-14

新智元報道

來源：Nature

編輯：大明

【新智元導讀】關於量子計算和機器學習之間的融合一直是業界關注的焦點。最近在《自然》上的一篇論文，從二者對數據處理方式的聯繫出發，將傳統計算機的數據映射到只存在量子態的空間中，實現面向圖像識別任務的監督式機器學習過程。量子計算機的「殺手級應用」可能很快就要誕生了。

目前，機器學習和量子計算的熱度可謂不相伯仲，從數學基礎上看，二者在某些方面也確實非常相似。

最近，在Nature上發表的一篇論文中，Havlí?ek等人從二者之間的聯繫入手，展示了現代量子計算機是如何從數據中進行學習的。論文表明，傳統計算機可以將數據映射到只存在量子態的空間中，實現監督式學習。

Nature論文：使用量子增強特徵空間進行監督式機器學習

一提到量子計算機，人們的第一印象往往是，這些機器很難在台式電腦等經典計算機上進行模擬。換句話說，無法使用經典計算機獲得量子計算的結果。因為描述量子計算的每個內部步驟需要大量的數字。許多人在學習分割大數字時需要的步驟極其繁多。如果在經典計算機上模擬量子計算，那麼每個中間步驟可能需要更多的數字來描述，這個數字甚至可能比宇宙中可觀察到的原子總數還要大。

將圖像「相似性」概念化為空間距離

由數字集合描述的量子系統的狀態被稱為量子態。如果量子態與許多數值相關聯，則稱其在大空間中「存在」。對於某些基於連續變數的量子計算機，這樣的空間甚至是無限大的。

相比之下，機器學習分析的數據空間要小得多，即用來描述數據的值更少。比如，包含一百萬像素的照片僅記錄了代表紅色、綠色、藍色的三百萬個數字。機器學習的任務目標可能是猜測圖像的內容，也可能是生成類似的圖像。不過，機器學習中一個成熟的理論稱為「核方法」（kernel method），對數據的處理方式與量子理論的數據處理的方式很類似。

簡而言之，「核方法」是通過定義哪些數據點彼此相似、哪些數據點不相似來執行機器學習任務的。從數學上講，相似性是數據空間中的距離，即數據點表示之間的距離的數字表示。

目前的假設是，相似的圖像具有相似的內容，數據點之間的距離在機器學習中是至關重要的。但對「相似」的確切定義並不像聽起來那麼簡單。比如，如果基於每個圖像中的紅色像素數量來看，兩個圖像之間的在數據空間中的距離是多少？

數據空間中許多關於「相似性」的定義，在數學上相當於在可能無限大的空間中的相似性的簡單量度。因此，在每次比較兩個圖像時，圖像可以被映射到巨大空間中的表示，並計算映射和原圖像之間的簡單相似性。目前，傳統計算機無法確切地計算這個大型表示，但也許量子計算機可以。因為量子計算機能夠在極大的空間中進行計算。如果將數據映射到量子態所在的空間，會發生什麼呢？

圖1 量子增強機器學習過程示意

「量子態」映射反映圖像相似性，提升機器學習性能

Havlí?ek等人展示了量子計算機如何提高機器學習演算法的性能。如上圖所示，先由傳統計算機使用機器學習對動物的圖像進行分類。包含相似顏色像素的圖像在數據空間中的距離較近。

經典計算機將這些數據發送到量子計算機，後者將每個圖像映射到對應量子狀態空間中的特定量子態。在數據空間中距離較近、但內容不同的圖像，由量子空間中相距很遠的狀態表示。然後由量子計算機將量子態間的距離發送至經典計算機，改善圖像分類效果。

Havlí?ek等人和筆者所在的研究團隊幾乎同時認識到了機器學習和量子計算之間這種潛在的強大聯繫。值得注意的是，兩個團隊提出了基本相同的兩種策略，設計用於機器學習的量子演算法。第一種策略僅使用量子計算機，作為傳統機器學習系統的硬體補充：量子設備在給定兩個數據點時返回相似性。第二種策略在量子計算機上進行真正的學習，以經典計算機作為輔助。

Havlí?ek等人的重要貢獻是他們在真正的量子計算機上的原理驗證實驗中實現了這兩種策略：他們使用的是IBM的量子晶元。儘管一些新聞報道有些誇張，但任何在雲中嘗試量子計算的人都知道，由於計算中的實驗雜訊水平很高，從這些設備中收集有意義的數據是非常困難的。

實驗使用的IBM Q量子計算機

在某些人看來，這個實驗。量子空間只有四個維度，因為在IBM雲服務已經能夠提20量子比特設備訪問，但這個實驗只使用了IBM最小的5量子位晶元的兩個量子比特。實驗中的數據集同樣是人工設計的，讓四維空間中的分析過程變得更簡單。

儘管如此，此文仍然證明了使用量子計算機進行機器學習的革命性方法，並提出了將更流行的人工神經網路融入量子計算領域的多種嘗試，「核方法」在機器學習和量子理論之間提供了一座橋，令人耳目一新。不過，發現並承認這座橋的存在只是一個開始。

Havlí?ek等人提出的方法的確切性還有待進一步觀察。儘管在量子空間中進行數據表示，對於真實世界的機器學習應用是有用的。不過，我們並不知道該方法是否與有意義的相似性量度相關，比如，在對動物的圖像進行分類時，是否可以做到將貓的圖片放置在另一幅貓的圖片附近，而不是狗的圖片附近。

此外，目前關於是否存在性能和效果更好其他策略，仍然不是十分清楚。這個技術是否足以戰勝已使用了近30年的經典方法？如果可以，量子計算機的「殺手級應用」可能很快就要誕生了。但這無疑是一個更加複雜的問題。

參考鏈接：

論文地址：

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 新智元 的精彩文章:

※谷歌提出元獎勵學習，兩大基準測試刷新最優結果
※LeCun：賦予機器「常識」，重新設計神經網路將是AI 研究重點

TAG:新智元 |