當前位置:
首頁 > 科技 > 如何評價 Intel 新發布的九代 i7-9700K?

如何評價 Intel 新發布的九代 i7-9700K?

如何評價 Intel 新發布的九代 i7-9700K?

不是9900K沒有超線程,而是9700K沒有超線程

首先9700K和9900K都是八核,單核頻率接近5Ghz(9900K已經5Ghz),8核睿頻都超過了原本8700K的六核睿頻,可以說Intel下決心以高頻率維持優勢,這也是10nm遲遲不出的一個主要原因,10nm一出頻率還低了,就比較尷尬

毫無疑問,9900K將輕鬆戰勝2700X,8核4.7Ghz的頻率,本身相對Zen的IPC優勢,向量化執行單元加倍和高頻內存下的低延遲內存性能,更好的NVMe性能,都能讓Intel在專業計算領域,日常使用和遊戲中保持優勢,最令人意外的是9700K沒有超線程,緩存也下降到12MB,而非9900K的16MB

如何評價 Intel 新發布的九代 i7-9700K?

超線程有何提升?

超線程指的是Intel的一個技術品牌名稱,更通俗的叫法是CPU核心的同步多線程技術,其通過多個線程利用多流水線後端,提高緩存命中率和降低指令阻塞時間,換言之,超線程技術沒有提高CPU的性能上限,CPU的計算峰值和處理峰值沒有發生改變,如果程序充分優化,不存在緩存缺失,流水線不遇到任何阻塞,有沒有超線程其實性能是一樣的,但如果程序的緩存命中率和緩存缺失越嚴重,當一個線程遇到需要等待緩存缺失的數據和指令,抑或分支預測失敗導致流水線清空,而需要等待掛起的時候,另一個線程發起請求繼續執行程序時,才能出現明顯提升,超線程允許另一個線程擁有一定的重複的寄存器資源和寄存器重命名許可權以及一些與之前線程一樣的buffer,這樣使得其能更快的介入到出現流水線阻塞的程序中,某種程度,他最理想的提升就是缺失率在50%的情況下,且正好這樣兩個線程交替執行,就比沒有超線程提升了一倍,但現實是100%順暢的程序不存在,恰好讓超線程完美等效交替互補(這裡的表達其實不具體)運行的程序也不存在,所以超線程的提升實際上可以是0也可以是1倍

如何評價 Intel 新發布的九代 i7-9700K?

流水線越多,後端執行單元越多,超線程提升越多

隨著現代處理器的超標量流水線設計已經成為常態,多個流水線多個後端執行單元的設計已經成為常態

如何評價 Intel 新發布的九代 i7-9700K?

實際上Intel後端用於實際執行相應指令的後端是4個,0,1,5,6這四個,其中這四個埠都有X86傳統指令執行單元,包括傳統的ALU,分支跳轉,地址偏移和載入,移位等指令,而向量埠只有三個,即0,1,5,其中非AVX512的處理器,也就是除了X299以外的酷睿處理器,除了向量邏輯,向量shuffle(寄存器數據重排)會使用埠5,主要將使用0和1兩個埠,也就是依託FMA單元的乘法,加法,向量跳轉,除法等計算密集項目,都主要由兩個埠負責,而理論上說,同時流水線並行的越多,出現緩存未命中的幾率越大,超線程介入的機會越大,也就是說同種類型的程序,但後端執行單元越多,超線程也會提升越大

向量計算程序超線程提升小,傳統程序提升大

由於傳統X86程序幾乎都會覆蓋到4個埠的執行單元,分支跳轉,地址載入,偏移地址和邏輯計算等指令在程序中都有不小佔比,可以預見,執行越傳統的X86程序,有機會帶來越高的超線程提升,而使用向量程序則不會,為此我做了一個簡單的驗證,AIDA64的性能測試非常有意思,我將其進行一個歸類

如何評價 Intel 新發布的九代 i7-9700K?

這些程序包含了傳統指令的分支預測,圖片處理,視頻壓縮編碼(SSE4.1),也有高內存帶寬,高向量化的程序,也有使用專用加密解密單元的AES-Hash,也有擴展精度的浮點計算,我使用了多個CPU進行測試

如何評價 Intel 新發布的九代 i7-9700K?

在使用老指令集計算的擴展朱莉婭集合(Sinjulia),CPU Queen,Zlib上,超線程都有最好的提升,AMD在支持SHA指令集的情況下,還具備雙倍於Intel的AES單元(4個),這樣在AES和SHA的超線程提升上也明顯高於Intel,值得注意的是,8121U也有SHA指令集,也擁有加強的AES單元,所以他的AES/Hash性能也非常出色,超線程性能也超越了Intel其他處理器

單發射FMA在向量計算上等於超線程很難提升

我們可以發現,在傳統指令上,包含SSE程序,AMD都有較好的超線程提升,這取決於我剛才說的Intel向量單元更多僅有2個的情況下,而AMD執行向量程序,由2個128bit乘法器和2個128bit加法器組成,這樣在執行128bit向量的時候,理論有4個後端執行,超線程更利於發揮,但在AVX FMA程序上,由於AIDA64優化較為理論,AMD需要兩個單元來執行一個256bit,FMA又需要兩個單元在一起在執行一次FMA,就等效於1個256FMA,所以在AVX項目上,AMD的超線程效率一落千丈,而Intel也存在向量程序超線程低於傳統指令程序提升的問題,但略高於AMD,不過8121U還是例外,他是單512FMA的處理器,所以他的超線程提升同樣極低

大緩存對密集計算有利

更大的緩存在日常中不太能感受到明顯差距,但在一些密集計算中能體現,比如一個4000X4000的DGEMM,就需要122MB的數據,顯然,緩存越大,有利於消除memory bound,不過實際操作有很多優化方法

SIMD超線程幫助不大,有時會有負作用

由於9700K比8700K多了33%的核心數,高了8%的頻率(4.6對4.3)所以超線程提升40%怕是才能一戰,但這其實並不容易,而且SIMD程序超線程的幫助越來越小,比如同為雙發射FMA的7820X,就顯得超線程對向量程序的幫助已經不大,不用超線程就已經很高了,而且有項目跑出來開與不開超線程成績會出現下降(下降幅度不定)所以超線程的未來,更多的是錦上添花,而非必不可少,對於遊戲也幫助不大,9700K依舊是一個很不錯的設計,但我還是更希望Intel拿出新的微架構,而不是繼續打磨Skylake

過幾周就有樣品了,不過覺得性能 不會有什麼意外

如何評價 Intel 新發布的九代 i7-9700K?

如何評價 Intel 新發布的九代 i7-9700K?

如何評價 Intel 新發布的九代 i7-9700K?

如何評價 Intel 新發布的九代 i7-9700K?

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!

TAG: |