當前位置:
首頁 > 科技 > Python 在將 R 絞殺至死嗎?

Python 在將 R 絞殺至死嗎?

就編程語言而言,Python炙手可熱,這點毋容置疑。Python起初是一種通用腳本語言,後來逐漸成為數據科學界最流行的語言。但Python是以犧牲R而成名的嗎?據IT行業的一些人士認為,答案是肯定的;他們稱,R這種語言壽終正寢。

有證據表明Python的受歡迎程度在影響R的使用率。據TIOBE指數排行榜顯示,Python目前是世界上受歡迎程度排第三位的語言,僅次於常年的兩大熱門語言Java和C:從2018年8月到2019年8月,Python的使用率增幅超過3%,達到10%的評級(TIOBE主要衡量搜索活動的專有標準),一舉成為20種受歡迎程度最高的語言中勢頭最猛的語言。

相比之下,R最近在TIOBE指數排行榜上表現不佳,它從2018年1月的第8位跌到了今天的第20位,受歡迎程度不如Perl、Swift和Go等語言。在2018年1月達到頂峰時,R的受歡迎程度評級為約2.6%。但是據TIOBE指數排行榜顯示,今天它跌至0.8%。

TIOBE指數排行榜的製作人員在7月份寫道:「Python的受歡迎程度持續增長,而相比之下其他編程語言的受歡迎程度因此下跌。R就是其中一種編程語言,Perl受到的影響更大。」

據TIOBE指數排行榜顯示,R最受歡迎的時候出現在2018年1月:

這導致一些專家宣稱R已奄奄一息。Dice Insights是一份與知名的技術行業薪資網站Dice有關的在線出版物,在7月份的文章中稱R是「可能註定失敗」的五種語言之一。

Dice Insights的資深編輯Nick Kolakowski寫道:「雖然R仍被學界人士和數據科學家所使用,但對數據分析感興趣的公司正紛紛轉向Python,沖其可擴展性和易用性而去。」他寫道,依賴「一小撮學界人士及其他無足輕重的人」使用可能不足以讓R活下來。

其他數據表明,Python這些年來的成功是以犧牲R和SAS(流行的專有分析環境)為代價的。作為薪資調查的一部分,Burtch Works一直在向數據科學家和分析師詢問他們青睞哪種環境:R、Python還是SAS。

2014年和2015年,SAS仍佔主導地位,但R迅速受到追捧。然而從2016年到2018年,Python異軍突起。2018年,Burth Works聲稱Python、R和SAS出現了三足鼎立之勢。其他民意調查表明了類似的動向。

Python顯然勢不可擋,但DataCamp的聯合創始人Martijn Theuwissen拒絕承認R已死或將死。他說:「聲稱R沒落的說法誇大其詞。如果你看一下R的發展,它仍呈發展的勢頭。從我觀察的情況來看,Python發展勢頭更猛。」

Theuwissen於2013年與Dieter De Mesmaeker和Jonathan Cornelissen共同創辦DataCamp時,公眾對R的興趣激增。實際上,R是DataCamp關注的焦點,DataCamp提供數據科學、數據分析和機器學習等方面的教育和培訓。從那以後,公眾對Python的興趣呈井噴之勢,今天除了Scala和SQL方面的課程外,DataCamp還提供Python和R方面的課程。

據Burtch Works針對首選建模環境的調查顯示,Python、R和SAS在2018年難分勝負:

Theuwissen說:「我們在六年前創辦公司時,面向數據科學的R大幅增長。我們很少聽到Python。但兩年後[2015年],我們聽到Python越來越多地應用於數據科學。」

試圖衡量語言的受歡迎程度是一項異常困難的任務。雖然語言確實有其生命力,但沒有萬無一失的方法可以確定它們在任何一個時間點處於生命周期的哪個階段。當然,沒有辦法以百分之百的把握來預測未來。

當Guido van Rossum早在20世紀80年代首次提出Python時,其目的不是創建世界上最流行的數據科學語言。誰會預測到Python後來大器晚成、成為數據科學和機器學習領域的通用語言?

與Python相比,R被認為是面向統計計算的語言。從20世紀90年代初一開始,R的兩位開發者:奧克蘭大學的Ross Ihaka和Robert Gentlemen尋求一種方法,結合S的結構和良好的用戶界面,以便學界人士、工程師及其他人可以建立統計模型並分析數據。

Ihaka在1998年的論文《R:過去和未來歷史》中寫道「我們在自己的Macintosh教學實驗室中既對統計計算感興趣,又看到普遍需要一種更好的軟體環境。我們發現沒有合適的商業環境,於是開始嘗試看看是不是可以自行開發一個合適的環境 。」

在過去三十年里,R早已擴大到紐西蘭之外的地區。據R Consortium這個致力於推廣使用這種開源語言的組織聲稱,目前全球使用R的用戶已超過200萬。開發人員通過CRAN編寫並開源了13000多個庫,以便自動執行各種統計任務和圖形繪製。

R Consortium在其網站上表示:「眾多組織已採用R語言作為數據科學平台,包括生物技術、金融、研究和高科技行業。R語言常常集成到第三方分析、可視化和報告等應用環境中,在眾多計算平台上運行。」

R的一個好處是,它在大學和學院當中廣泛教授。許多在多門學科攻讀科學學位的研究生學習R用於統計建模。隨著對數據科學家的需求不斷增長,「硬」科學方面受過訓練的這些人中許多將他們的統計能力運用於新的數據科學行業,隨之帶來了R知識。

Python也在高等院校中予以教授,但它更常出現在計算機科學系,而不是天文學系或野生動物生物學系。隨著這些大學畢業生走上工作崗位、成為軟體工程師,Python成了他們偏愛的語言之一。當這些人轉而進入數據科學崗位時,他們更倚重Python再自然不過了。

在一則題為「R是否進入死胡同?」的Reddit討論中,許多人全面比較了R與Python的諸多技術優勢。一個反覆出現的主題是,雖然用戶運用R或其中一個庫也許能夠直接完成幾乎任何統計任務,但是有人擔心這種語言根本跟不上Python,在Web瀏覽器中運行時更是如此。(R的可擴展性存在明顯的限制是R抨擊者當中經常提到的另一個主題。)

一些Reddit用戶寫道,另一方面,Python從廣泛可用的Numpy等統計庫受益匪淺,在瀏覽器中使用時如魚得水。Python很容易在數據科學筆記本(比如iPython和Jupyter)中用於建模。雖然R也可以在像Jupyter這樣的數據科學筆記本中使用,但Python是默認模式。

DataCamp的Theuwissen表示,Python生態系統正趕超R生態系統。自從微軟在2015年收購Revolution Analytics以來,專註於R的數據科學和分析軟體供應商的數量在縮減。

他說:「除了R Studi外,我認為沒有大公司在推動這種語言發展。至於Python,很多人在為這個生態系統做貢獻。」

除了發布名為Microsoft R Open的開放版本外,微軟仍然開發並支持它通過Revolution Analytics交易獲得的R軟體。然而,核心的R產品不再有R這個名稱,而Python正是原因所在。微軟上個月在一篇博文中寫道:「該產品已從R Server改名為Machine Learning Server,以體現新增基於Python的分析產品這一事實。」

數據科學領域龐大而繁雜。雖然它在過去幾年明確表明看好Python,但這並沒有削弱人們對其他語言的貢獻或個人在其他環境中做好工作的潛力。

眼下這個特定時期,Python的前途可能比R來得光明,但並不意味著R就沒有前途。Python對一些數據科學工作來說可能是最佳工具,但對其他工作而言,R很難擊敗。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 雲頭條 的精彩文章:

釘釘併入阿里雲
緩存資料庫架構過時了,是時候採用混合內存架構了

TAG:雲頭條 |