搜索引擎如何使用機器學習:我們需要知道的9種方式
AiTechYun
編輯:nanan
當我們在2010年初初次聽到機器學習的時候,可能會感覺它很可怕。
但當我們意識到技術已經被用來為我們提供解決方案時,我們就開始著手解決實際問題:
—搜索引擎如何使用機器學習?
—它將如何影響SEO?
機器學習本質上是利用演算法來計算基於歷史數據的特定事物的趨勢、價值或其他特徵。
Google甚至宣稱自己是一家機器學習型公司。
如果你想了解更多關於這項技術的戰術方面的知識,Eric Enge在Moz上寫了一篇很棒的文章,解釋了機器學習如何從數學的角度來影響SEO。
搜索引擎總是喜歡嘗試如何使用這種不斷發展的技術,但我們知道他們目前正在使用機器學習的九種方式,以及它與SEO或數字營銷的關係。
1.模式檢測
搜索引擎正在使用機器學習模式檢測,以幫助識別垃圾郵件或重複內容。他們插入了低質量內容的共同屬性,比如:
—存在幾個到不相關頁面的出站鏈接。
—大量使用停止詞或同義詞。
—其他這樣的變數。
能夠檢測到這些模式,極大地減少了對人力的投入。
儘管仍然存在著高質量的評估者,但機器學習已經幫助Google自動篩選頁面來清除低質量的頁面,而不需要人們先看它。
機器學習是一項不斷發展的技術,因此分析的頁面越多,它就越準確(理論上)。
2.識別新信號
根據2016年Google的Gary Illyes的播客,RankBrain不僅可以幫助識別查詢模式,還可以幫助搜索引擎識別可能的新排名信號。
這些信號受到追捧,因此Google可以繼續提高搜索查詢結果的質量。
Illyes在播客節目中也提到,Google的更多信號可能會成為基於機器學習的信號。
由於搜索引擎能夠教授技術如何獨立運行預測和數據,因此可以減少體力勞動,員工可以轉向其他機器不能做的事情,比如創新或以人為中心的項目。
3.它作為一個小部分被加權
然而,儘管機器學習正在慢慢改變搜索引擎查找和排名網站的方式,但這並不意味著它對我們的SERP產生重大影響(目前)。
在同一個播客採訪中,Illyes表示,這只是他們整體排名信號平台的一部分,並且被加權為整體演算法的一小部分。
Google的最終目標是利用技術為用戶提供更好的體驗。他們不想讓整個過程自動化,否則這就意味著用戶沒有他們想要的體驗。
所以,不要認為機器學習將很快取代所有搜索排名; 它只是搜索引擎實施的一小部分而已,它希望使我們的生活更容易。
4.基於特定查詢的自定義信號
根據華盛頓大學2017年7月的一項研究,搜索引擎中的機器學習可能因查詢類別或措辭而有所不同。
研究人員使用俄語搜索引擎Yandex來對不同的搜索結果進行分析。他們發現顯示的結果類型主要取決於查詢類別或措辭。
這意味著機器學習可以在某些特定的查詢中對變數施加更多的權重。
總的來說,通過機器學習定製的個性化搜索將結果的點擊率(CTR)提高了10%。
隨著用戶對Yandex輸入更多查詢時,發現CTR繼續增加。
這可能是因為搜索引擎正在「了解」特定用戶的偏好,並且可以基於過去的查詢來提供最有趣的信息。
會議演示中經常使用的一個例子是一次查詢中的一串查詢,以及結果如何根據上次搜索的內容而變化。
例如,如果我在隱身瀏覽器中搜索「紐約足球場」,我就得到了「MetLife Stadium」的答案。
接下來,如果我在同一個瀏覽器中搜索「jet」,Google假設因為我的最後一個查詢是關於一個足球場的,那麼這個查詢也是關於足球的。
當我繼續搜索時,Google知道我什麼時候變成了別的東西。
在同一個瀏覽器中搜索「美洲虎」將會帶來關於美國國家橄欖球聯盟(NFL)球隊Jacksonville美洲豹的信息(與我最近兩次的搜索有關)。
但是,我在搜索「聖地亞哥附近的動物園」的實例,然後在查詢框中又開始輸入「Zoo」, Google建議「美洲虎動物園」,儘管我沒有再次搜索美洲虎。
搜索歷史只是機器學慣用來提供更好結果的搜索體驗的一個組成部分。
5.圖片搜索,以了解照片
早在2013年,據報道,Flickr用戶每天上傳140萬張照片,4000萬張上傳至Instagram, Facebook用戶上傳3.5億張照片。
雖然這些統計數據可能已經上升(很難找到更多最近的數據),但它顯示了需要在web daily上編目和分析的照片數量。
此任務非常適合機器學習,因為它可以分析顏色和形狀模式,並將其與任何現有的有關照片的模式數據配對,以幫助搜索引擎了解圖像的實際內容。
這就是Google不僅能夠為Google圖像搜索結果提供目錄圖像,還能提供允許用戶通過照片文件進行搜索的功能(而不是文本查詢)。
然後,用戶可以在線查找照片的其他實例,也可以找到與照片中主題相同或顏色相同的照片,以及照片中受試者的信息,就像經典聖誕電影的例子:
用戶與這些結果交互的方式可以在未來塑造他們的SERP。
6.識別搜索查詢中的單詞之間的相似性
機器學習不僅可以使用查詢數據來識別和個性化用戶的後續查詢,而且它還有助於創建數據模式,從而形成其他用戶所得到的搜索結果。
Google趨勢是一個很好的正面例子。一個短語或詞最初並不意味著任何東西(例如:「planking」或「it 『s lit」)可能會產生無意義的搜索結果。
然而,隨著時間的推移,它的措辭越來越多,機器學習能夠顯示出更準確的信息。
隨著語言的發展和變化,機器能夠更好地預測我們說的話背後的含義,並為我們提供更好的信息。
7.提高廣告質量並為用戶定位
根據Google美國專利US20070156887和US9773256的廣告質量,機器學習可以用來改進「其他弱的統計模型」。
這意味著廣告排名可以受到機器學習系統的影響。
「出價金額,你拍賣時間的廣告質量(包括預期的點擊率,廣告相關性和登陸頁面體驗),廣告等級的閾值,人員搜索的上下文」通過關鍵字逐字輸入系統,以確定Google為每個關鍵字考慮的閾值。
8.同義詞識別
當你看到在代碼片段中不包含關鍵字的搜索結果時,可能是由於Google使用RankBrain來識別同義詞。
當你在攻讀博士學位時,你會看到各種各樣的「醫生」或「博士」的結果,因為它們在許多程度上是可以互換的。
Google甚至在某些情況下突出了同義詞,這次是「博士學位」,進一步表明它正在識別同義詞。
9.查詢澄清
我最喜歡的主題之一是搜索查詢用戶意圖。
用戶可能正在搜索購買(交易)、研究(信息),或者尋找任何給定搜索的資源(導航)。此外,一個關鍵字可能對其中一個或任何這些意圖有用。
通過分析點擊模式和用戶使用的內容類型(例如按內容類型選擇點擊率),搜索引擎可以利用機器學習來確定意圖。
在Google搜索中查詢「best college」可以看到一個例子。結果是一份SERP的評論和大學名單,其中大學排在最前面。
總結
雖然機器學習不是(也可能永遠不會)很完美,但人類與之互動的越多,它就會變得越準確、越「聰明」。
這可能會讓一些人感到擔憂——從《終結者》的電影中帶來天網的景象——然而,當我們需要的時候,實際的結果可能是一種更好的技術體驗,給我們提供我們需要的信息和服務。


※誤區解讀:機器學習和深度學習之間的區別和使用情況
※對初學機器學習的三點建議
TAG:機器學習 |