當前位置:
首頁 > 最新 > SparkContext 初始化內部原理

SparkContext 初始化內部原理

劉彬同學準備寫一系列spark實戰系列,本文是第一篇,SparkContext初始化內部原理!贊!推薦給大家,希望大家喜歡和支持!

如果編寫Spark程序,那麼第??代碼就是new SparkContext().setMaster(「」).setAppName(「xx」),可以說SparkContext是整個Spark 計算的啟動器,只有將sparkContext 啟動起來,後續的關於調 度,存儲,計算相關的操作才能夠運?,本?基於spark2.x源碼概述關於SparkContext??所包含的啟動項都有哪些以及這些啟動項的作?是什麼,之後在說?下關於SparkEnv環境創建的過程。

閱讀本?最好打開spark源碼參考著看,可以在git上?打開spark關於sparkContext的代碼,地址為:https://github.com/apache/spark/blob/c5f9b89dda40ffaa4622a7ba2b3d0605dbe815c0/core/src/main/scala/org/apache/spark/SparkContext.scala#L73

01

SparkContext內部組件:

如圖為SparkContext內部的?些組件:

除了以上這些SparkContext包含的內部組件,還包括如下?些屬性:

_eventLogDir:事件?志的路徑,當spark.enabled屬性為true時啟?,默認為/tmp/spark-events,也可以通過spark.eventLog.dir來指定?錄 _eventLogCoder:事件?志的壓縮演算法,當spark.eventLog.enabled屬性與spark.eventLog.compress屬性為true時,壓縮演算法默認為lz4,也可以通過spark.io.compression.codec屬性指定,?前?持lzf,snappy和lz4

02

初始化具體流程

以上可以在github上打開spark源碼進?邊看?章邊看源碼,你會受益良多。 在這?推薦?個github源碼閱讀插件Insight.io for Github 在chrome擴展程序里可以直接查詢。

加入技術討論群

《大數據和雲計算技術》社區人數已經2500+,歡迎大家加下面助手微信,拉大家進群,自由交流。

喜歡釘釘群的,可以掃描下面二維碼:

喜歡QQ群的,可以掃描下面二維碼:

歡迎大家通過二維碼打賞支持技術社區(英雄請留名,社區感謝您,打賞次數超過55+):

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 Hadoop技術學習 的精彩文章:

TAG:Hadoop技術學習 |