當前位置:
首頁 > 知識 > 國內一線大數據專家分享:大家都在用Hadoop的原因是什麼?

國內一線大數據專家分享:大家都在用Hadoop的原因是什麼?

前不久,筆者整理了部分一線互聯網公司的大數據平台架構圖(感興趣可自行查看《摸底10餘家一線互聯網公司大數據架構圖:Hadoop滲透力太強!》),引來不少用戶的關注。從文章可以看出:Hadoop生態系統對互聯網公司大數據平台架構的滲透力是極其強大的。

我們似乎習慣了在提到大數據的時候想起Hadoop,但是為什麼企業(當然,不單指互聯網公司)都在用Hadoop?沒有其他更合適更完美的解決方案嗎?Spark生態日趨完善,頻頻叫囂Hadoop,Hadoop會陷入危機嗎?

針對上述問題,筆者將對有代表性的大數據服務廠商的一線技術專家進行走訪,了解他們對Hadoop的選擇意願以及原因、搭建大數據平台時最看重哪些因素、對Hadoop的未來持何種態度。

本期嘉賓:

國內一線大數據專家分享:大家都在用Hadoop的原因是什麼?

王蘋,榮之聯解決方案架構師。曾就職於IBM大數據團隊,具有多年大數據平台研發經驗。目前專註於大數據企業級應用的方案設計及技術選型,同時帶領團隊研發榮之聯大數據產品。

地位堪比晶元:為什麼企業願意使用Hadoop?

榮之聯對企業用戶提供大數據平台產品DataZoo,最底層的基礎層基於Hadoop開源生態構建,目前已在公安,證券、電商,新媒體、車聯網和生物醫療幾大領域落地。速度上明顯落後Spark的Hadoop到底有什麼優點?榮之聯為什麼這樣選擇?企業用戶對大數據平台有哪些需求?

榮之聯選擇Hadoop的原因很簡單:Hado平台研發op足以解決現階段企業用戶的大數據問題;Hadoop生態成熟完整,成功案例眾多,站在巨人的肩膀上看得更遠;我們有相關人才,具有大數據能力的專業團隊。

想必正在使用Hadoop的廠商和榮之聯有不少共鳴。除了Hadoop自身的優勢,人才也是重要因素。當Hadoop工程師開始慢慢增多,國內的Hadoop生態發展進入升溫階段。

企業用戶願意用Hadoop,原因也很簡單:滿足需求,支持全面。大多數時候,企業用戶沒有互聯網公司樂於冒險,他們更願意選擇成熟穩定的解決方案。王蘋透露,企業用戶往往很看重性能指標,還有易用性、穩定性等。Spark雖然速度足夠快,但穩定性上遠遠不如Mapreduce,二者合作使用是很受歡迎的方案。

此外,Hadoop的支持十分成熟完善,有來自開源社區的支持還有像榮之聯這類大數據服務廠商的支持。隨著信息技術的發展,越來越多的傳統企業開始擁有自己的信息化團隊,相比昂貴的商用解決方案,他們更傾向於基於開源基礎搭建,Hadoop生態系統中的組件豐富使之成為優先選擇對象,國內大數據服務廠商的技術支持也讓他們有了底氣。當然,不具備信息化團隊的企業同樣可以通過全盤接收榮之聯等廠商的大數據服務享受到Hadoop的優勢,這類企業在選擇時會更加謹慎,更加傾向於應用企業較多的解決方案。

綜上,這些原因造成企業用戶大批量選擇Hadoop,大數據服務類廠商使用Hadoop的現狀。

王蘋認為,Hadoop足以解決目前企業用戶面臨的大數據問題,並且也是目前最合適的解決方案。

Gartner:25%的Spark正在脫離Hadoop生態單獨運行!

Gartner報告其實是該系列調查的導火索。在早前的報告中Gartner曾指出,儘管企業對大數據解決方案的需求不斷增長,但對Hadoop的需求沒有像預期那樣加速。同時,25%的Spark已經開始脫離Hadoop生態單獨運行。

這在預示著Spark的崛起和Hadoop的衰落嗎?

國內一線大數據專家分享:大家都在用Hadoop的原因是什麼?

作為一線大數據工程師,王蘋認為在快節奏的IT圈,任何一種技術發展到一定階段都會被挑戰。當然,無風不起浪,Hadoop作為分散式系統基礎架構,本身確實有一定問題,但這並不代表新興技術已經具備抗衡Hadoop的能力,新技術的挑釁恰恰會促進Hadoop的發展。Gartner肯定了大數據解決方案仍然是目前的熱門領域,而Hadoop已經進入成熟期。

對,沒錯,是成熟期。王蘋解釋道,企業做大數據是價值導向,通過數據驅動業務。正是因為Hadoop已經進入成熟期,國內外企業基本已經布局完成,對Hadoop的關注度才會下降,對Hadoop的需求也會相應減少,這就比如現在都在關注人工智慧,因為那是未來。

Hadoop當然不是完美的,但它在大數據平台中的地位是標誌性的。Spark生態確實日漸成熟,它早已不是單槍匹馬的戰鬥了。對於數據量較小、存儲需求較小的企業而言,單獨構建Spark系統架構是可以的,但Spark面臨的問題遠比Hadoop要多。

總之,Spark與Hadoop本可成為最默契的戰友,相互配合完成一場漂亮的防禦戰,沒必要成為商業廝殺的武器。

大數據領域,即便出現新技術,不與Hadoop打配合,何談市場?

眾所周知,Hadoop源於谷歌描述GFS和MapReduce的研究論文,Hadoop社區很多優秀的工程師坐標也都在國外,對Hadoop叫囂最猛烈的浪潮基本也來自國外。曾經,谷歌造就了Hadoop,之後,谷歌又找到了Caffeine、Dremel等開始替代Hadoop生態系統中的組件。

王蘋對谷歌的做法並不意外,也並不慌亂。她認為,谷歌作為技術領先型的互聯網企業,追求技術創新很正常,但這與國內企業用戶的需求並不完全吻合。就現狀而來,Hadoop的未來應該是逐漸成熟,而不是走向衰落。

國內一線大數據專家分享:大家都在用Hadoop的原因是什麼?

即便Hadoop有一天真的失寵了,那就意味著一定有新的足以接手Hadoop的技術出現。反過來想,現在的大數據領域,任何新技術的出現恐怕都會考慮與Hadoop的兼容性,否則市場將很難開展。

採訪最後,王蘋表示,即便Hadoop真的不行了,榮之聯也不並擔心。DataZoo的基礎層可以隨時抽出替換新的技術。

企業不妨想想,你目前應用的大數據架構是否具備未雨綢繆的能力呢?

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 IT168企業級 的精彩文章:

IDC預測:2018年智慧城市支出將達800億美元
Gartner分析:企業選擇雲呼叫中心的十大原因

TAG:IT168企業級 |