老夫桌上有酒,不喜獨�,聞�(shù)家國�(chǎn)CPU有擅桌面�,故許利淘寶陸續(xù)擒得之,長隨老夫左右伴飲。已得龍芯、海�、飛�、兆芯四姓圍�,皆為桌面CPU才俊,老夫甚慰�
此日海光新至,為其接�(fēng)飲宴。席間其樂融�,眾CPU互報姓名,曰�海光C86-3250、龍�3A5000、飛騰D2000、兆芯KX-U6780A。其間海�3250言其太上蠻橫,只許子弟行走于服�(wù)器和工作站之�,圍坐桌面乃是越�,此番被禁于此方知桌面之妙,愿以文會�,以人鑒�。老夫雖知其本�,卻亦有意相試各CPU才情,便允其以文會友之請�
然唯有龍�3A5000躍躍欲試,飛騰D2000及兆芯KX-U6780A皆面色有異。老夫頗為不解,此二子平日豪言已至國際先進水平,此時緣何畏懼?為探知真相,余喚來四位海外桌面CPU王侯,與國產(chǎn)四俊以同題相�,印證各CPU水平究竟�
再觀�CPU顏色,龍�3A5000對海外王侯竟�“彼可取而代�”之豪情。海�3250面色淡然,似無爭強之�。飛騰D2000和兆芯KX-U6780A兩股�(zhàn)�(zhàn),幾欲先�。老夫見此情景更生疑惑,先令家仆閉門,再令所有CPU報上各自參數(shù)。往酒缸中投入幾枚青梅后,便擬定�SPEC CPU2006&2017、Stream、UnixBench試之,數(shù)日后定要見個分��
上表8款CPU中,紙面參數(shù)最弱者是龍芯3A5000,僅�4�2.5GHz。次弱者是Intel i5-6500,亦�4�,但最高頻率較龍芯3A5000多出44%,余�6��8核�10核皆�。海�、兆芯、飛騰皆�8�,主頻也相近,余更不解兆芯和飛騰何以畏縮�
在四款國�(chǎn)CPU�,只有海光支持超線程,它的核心是購自AMD的初代Zen,但3250的主頻僅�2.8GHz,比AMD相同核心的產(chǎn)品低了很多。所有的國產(chǎn)CPU主頻都不�,大約都只有Intel和AMD同類�(chǎn)品的一半左�,也就是說即使國�(chǎn)CPU每GHz的性能與Intel和AMD相差無幾,單核性能也只有它們的一半左��
�(yán)格地說,四款國產(chǎn)CPU都不支持睿頻,海光雖言說有睿頻,但無法開啟。龍芯和飛騰都是固定頻率,海光和兆芯支持在低�(fù)載時自動降頻。但海光和兆芯的TDP決定�,就算降了頻功耗也低不到哪兒去,可以用于桌面和工作�,做筆記本CPU就有些不合時��
兆芯和飛騰也與海光一樣也走的是先引進再自主的路線,不過這么多年過去,它們的CPU核心有多少自主設(shè)計的成分尚不可知。特別是兆芯CPU VendorID仍是初始�(shè)計者CentaurHauls,就更顯疑竇叢生�
四款國產(chǎn)CPU中唯一從零開始自主�(shè)�CPU核心的只有龍�3A5000,可它非但主頻比海光3250和兆芯KX-U6780A低,且核心數(shù)量也只有另外幾款國產(chǎn)CPU的一�,令它同臺競技似乎有些不近人情,但它已然摩拳擦�,那還是不要按捺的好。若把各款CPU的單核測試成績都折算�1.0GHz的得�,倒是可以稱量稱量龍芯3A5000的核心設(shè)計水平與其它CPU相差幾許�
SPEC CPU 2006�2017都是�(yè)界公�(rèn)的專�(yè)的CPU通用性能評估工具,兩者是在不同年代發(fā)布的不同版本。它們測試的是CPU整數(shù)和浮點通用處理性能,重點在“通用”這兩個字。整�(shù)通用性能代表了常�(guī)桌面和服�(wù)器軟件在CPU上運行時的性能表現(xiàn),浮點通用性能則側(cè)重于科學(xué)計算、人工智能等專業(yè)任務(wù)的性能表現(xiàn)。各家CPU廠商在發(fā)布新�(chǎn)品時,通常都會�(fā)布SPEC CPU的整�(shù)通用性能評估�(jié)�,一般都包含了單任務(wù)和多任務(wù)兩種模式的測試成績�
int_speed:單任務(wù)整數(shù)通用性能,編譯器不開啟自動并行化時表示單核性能�
fp_speed:單任務(wù)浮點通用性能,編譯器不開啟自動并行化時表示單核性能�
int_rate:多任務(wù)整數(shù)通用性能,任�(wù)�(shù)≥核心�(shù)量時代表全CPU性能�
fp_rate:多任務(wù)浮點通用性能,任�(wù)�(shù)≥核心�(shù)量時代表全CPU性能�
SPEC CPU是包含了�(shù)十個性能評估項目的測試套�,涵蓋了眾多�(lǐng)域和場景的應(yīng)用算法,測試�(nèi)容以C、C++、Fortran源代碼的形式提供�程序中沒有嵌入針對特定架�(gòu)�(yōu)化的匯編代碼,以保證它在跨架�(gòu)測試時的公平�。測試者需要自行配置編譯器和編譯參�(shù),由SPEC CPU的測試程序根�(jù)配置自動編譯并運行測試項�。編譯優(yōu)化參�(shù)可以配置為base和peak兩種模式,區(qū)別是peak模式允許對每一個測試項目單獨配置優(yōu)化參�(shù),并且支持二次編譯優(yōu)�。因此操作系�(tǒng)、編譯器類型、編譯優(yōu)化參�(shù)對測試成績有很大影響。有的測試者還會使用第三方�(yōu)化組件、開啟單任務(wù)自動并行化�32位和64位混合編譯等手段來提高測試成�。內(nèi)存性能也對測試成績有影�,但主要影響多任�(wù)并行時的成績,對單任�(wù)的測試成績影響較為有�,硬�、顯卡等其它�(shè)備對測試�(jié)果的影響可以忽略不計�
“單任�(wù)并行�”是把單線程程序中的部分循�(huán)代碼拆分到多個核心上并行運行的技�(shù)�在一段循�(huán)代碼�,如果改變每次循�(huán)的順序不會影響運行結(jié)�,那么這個循�(huán)就可以并行化� 如果在編譯時允許�“自動并行�”,那么單任務(wù)的測試成績就不能代表單核性能。SPEC CPU2006版的“自動并行�”依賴編譯器分析代碼的能力�2017版在是測試集源碼中添加了對OpenMP的支�,也就是由源碼的編寫者手工指定哪些循�(huán)代碼可以并行�(zhí)��在引�OpenMP之后,就弱化了編譯器自動并行化的作用,使性能評估更加�(guī)�。因此在SPEC CPU2017的測試中,對單任�(wù)必須明確�(biāo)注使用了多少個線��
SPEC CPU的測試集中可以并行化的代碼不多,CPU核心越多開啟并行化后的收益就越高。但大多�(shù)普通軟件的源碼中可以被并行化的代碼比SPEC CPU更少,編譯器的自動并行化又可能對軟件的其余部分造成�(fù)面影�,因此幾乎只被用來跑�。除了自動并行化之外,把GCC換成ICC也能把總成績提升10%左右,再開啟ICC增強�“自動向量�”還能再提�10%左右,然后再加上第三方優(yōu)化組件也能把總成績提�10%左右,最后再換成peak模式對每個測試項目單獨調(diào)�(yōu),并且開啟二次編譯優(yōu)�,還能把成績再提�10%左右……然�上述所有的提分手段對普通應(yīng)用軟件的增益都遠(yuǎn)不如SPEC CPU跑分明顯,反而會引起兼容性和�(wěn)定性降低的問題,因此凡是有大量用戶的知名軟件都會避免使用這些跑分專用�、近似于“作弊”的優(yōu)化技�(shù)�
此次測試都使�UOS系統(tǒng),國�(chǎn)CPU使用UOS專業(yè)�,進口CPU使用UOS家庭�。編譯器都使用系�(tǒng)中內(nèi)置的GCC、G++、GFortran 8.3版本,不使用任何的第三方�(yōu)化庫,也不開啟單任務(wù)自動并行�,測試項目都�(tǒng)一編譯�64位,只測試base模式的成�。之所以不使用那些有助于提升測試成績的額外的優(yōu)化方法,是因為需要滿足所有前置條件才能獲得的高分對軟件開�(fā)者沒有意�、對軟件用戶更沒有意義。有些CPU廠商用專門�(yōu)化得到的peak成績?nèi)?biāo)同行正常測試的base成績,是極端不自信的自欺欺人的表�(xiàn)�只有不使用那些跑分專用技巧時得到的測試成�,才能代表用戶能體驗到的CPU性能�
為了使對比更加公�,老夫?qū)幾g�(yōu)化參�(shù)也作出了限制�除了因為CPU指令集(架構(gòu))不同而不得不修改的參�(shù)之外,其它的編譯�(yōu)化參�(shù)都完全一�。免得它們到時候說別人成績好是因為編譯參數(shù)�(yōu)化得�,自己成績差是老夫故意劣化,凡是以此種借口掩耳盜鈴�,一律打出門��
為了得到AMD的兩款CPU較為�(zhǔn)確的每GHz的成�,就給它們加測了一次固定CPU頻率時的成績。一來為了驗證海光購買的AMD Zen核心和比它更新一些的Zen+核心有多大差�,二來因為龍芯說下一�3A6000每GHz的成績和Zen3相當(dāng),老夫提前收集一點兒�(shù)�(jù),等3A6000�(fā)布后方便驗證是否與宣傳相�,到時候該夸就夸該罵就��
通過對表中成績的解讀,可以得出以下結(jié)論:
CPU的頻率控制很影響性能�(fā)��
�(dāng)由主板和系統(tǒng)自動控制CPU頻率�,CPU的頻率會根據(jù)�(fù)載和溫度不斷變化,不同的CPU、主板、操作系�(tǒng)和設(shè)�,都會影響控制頻率的策略。AMD的兩款CPU在單核高�(fù)載時,頻率被控制在默�(rèn)頻率附近,在多核高負(fù)載時才更接近最高睿�。而Intel的CPU就正好相�,單核高�(fù)載時傾向于保持睿�,多核高�(fù)載時反而降到了默認(rèn)頻率附近。導(dǎo)�10�20線程的i9-10850k在多任務(wù)測試中表�(xiàn)得不�,相對于R5-5600G來說成績沒有核心�(shù)量的差距那樣大�
在不鎖定CPU頻率時測試單任務(wù),R5-2600平均頻率約為3.3GHz,R5-5600G平均頻率約為3.4GHz,i5-6500平均頻率約為3.5Ghz,i9-10850K平均頻率約為4.8GHz�
4款國�(chǎn)CPU在測試過程中都能保持在最高頻率,性能表現(xiàn)�(wěn)��
CPU頻率相近不等于單核性能相近�
例如兆芯KX-U6780A在SPEC CPU 2006�2017的測試中,單核整�(shù)成績分別�15.5�2.26,僅為海�3250�50%�60%,也只有龍芯3A5000�60%左右,而它們的主頻差距很小。這說�頻率不能單獨決定CPU單核性能,CPU的單核性能等于“頻率×IPC”�IPC�“每周期執(zhí)行的指令�(shù)”,在相同頻率下IPC越高的CPU,通過測試軟件得到的成績越高�
�(dāng)�(nèi)存頻率不變時�IPC隨CPU頻率升高而降低,因此把單核成績折算到每GHz成績會有誤差。但是當(dāng)�(nèi)存帶寬不是瓶頸時,它對測試成績的影響就較�,所以把5GHz時的單核測試成績折算�1GHz時產(chǎn)生的誤差可以忽略不計�
CPU核心的邏輯設(shè)計、物理設(shè)�、以及制程工藝的水平提升必須并重,特別是在國�(chǎn)CPU的物理設(shè)計和制程工藝短時間難以突破的情況下,更有必要通過提高邏輯�(shè)計能力來提高IPC�
AMD說Zen+比Zen的IPC提升�3%,這里對海�3250和AMD R5-2600的測試沒有體�(xiàn)出來,主要原因是UOS專業(yè)版對x86多了一些額外的�(yōu)�,老夫也用家庭版在相同條件下測試過海光3250,SPEC CPU 2006單核整數(shù)成績沒過30�,符合Zen+比Zen的IPC提升�3%的說��
在整�(shù)通用性能方面�龍芯3A5000核心邏輯�(shè)計水平和海光3250(AMD Zen)相�(dāng)。在Zen的IPC水平�,龍�3A5000的主頻要比海�3250�0.3GHz,導(dǎo)致單核性能也要低一�。龍芯下一�3A6000的核心邏輯設(shè)計水平可能和AMD Zen3相當(dāng),且整數(shù)和浮點IPC都與Zen3差不��
對于不同�CPU,浮點性能與整�(shù)性能不一定是相同比例�
例如幾款x86指令集的CPU,只有兆芯KX-U6780A的浮點成績比整數(shù)成績�,與VIA歷史上的所有CPU都如出一�。飛騰D2000的浮點成績比整數(shù)成績�,也體現(xiàn)了ARM的傳�(tǒng)�(fēng)��
龍芯3A5000在SPEC CPU 2006測試中浮點成績與整數(shù)成績差不�,但SPEC CPU 2017的測試成績低于本人預(yù)�,懷疑是由于GFortran編譯器對LoongArch架構(gòu)�(yōu)化不足的緣故�
SPEC CPU 2006 �2017的測試成績沒有固定的換算比例
雖然SPEC CPU 2006�2017是同一款性能評估套件的兩個版�,有部分測試項目相似,但是它�?nèi)匀皇莾煞N不同的性能評估工具,所得到的成績不能相互換��
比如飛騰D2000和KX-U6780A在使用SPEC CPU20017進行測試時,表現(xiàn)得就比使用SPEC CPU2006的時候更�,每款CPU的兩種測試成績的比例都不相同�
本次測試沒有鯤鵬920,但這里有一份來自鵬城實驗室的SPEC CPU 2017測試成績供參�,我們暫時只�(guān)注單任務(wù)的測試成績:
表中是用48核的鯤鵬920�64核的飛騰FT-2000+進行對比,F(xiàn)T-2000+的核心和本次測試的D2000一�,但主頻要低一�,因此單任務(wù)單線程的int_speed成績只有2.11,比D2000�2.28要低一�。不過FT-2000+�64個核心,所以單任務(wù)64線程的測試成績就要比D2000高一�。按公開資料中的說法,鯤�920�48核版本主頻是2.6GHz,但它單任務(wù)單線程的int_speed成績只有3.01,�2.5GHz的龍�3A5000得分�3.51。但已知鯤鵬920�2.6GHz時用SPEC CPU 2006測試的int_speed成績和龍�3A5000相近,這又是一�2006�2017的成績不存在固定比例的例��
雖然兩個版本的SPEC CPU的測試成績不存在固定比例,但測試成績都與CPU性能強相�(guān)。使用同種沒有針對特定環(huán)境優(yōu)化的測試工具進行橫向?qū)Ρ葧r,性能越高的CPU成績就一定會越好�
CPU多核性能不是對所有核心簡單疊��
無論是整�(shù)還是浮點測試,每個核心的平均效率總是會隨著并行任�(wù)�(shù)量的增加而降�。在CPU頻率不變的情況下,影響多任務(wù)效率的主要因素是�(nèi)存帶寬和多核心的互聯(lián)效率�CPU性能越高,內(nèi)存帶寬不足造成的負(fù)面影響就越大;CPU核心�(shù)量越�,核間互�(lián)效率就越��
盡管海光3250無論整數(shù)還是浮點性能都比R5-2600�,但它畢竟是8�16線程,全CPU的多核性能�6�12線程的R5-2600是差不多�??赡馨押�?250看作降頻版本的AMD R7-1700更加恰當(dāng),因為都�8�16線程,都是Zen核心�
飛騰D2000和兆芯KX-U6780A有濫竽充�(shù)的嫌�,它們也都是8個核心,測試成績所代表的多核性能卻還不到海光3250的一�,和4核的3A5000的多核成績非常接��
特別是兆��KX-U6780A單核每GHz的成績和10年前引進的VIA C4350AL相比大約只提升了10%。但是VIA C4350AL的內(nèi)存是DDR3 1333單通道,而KX-U6780A是DDR4 2666雙通道�老夫毫不懷疑4倍的�(nèi)存帶寬可以把IPC提高10%�
�ZX-A到ZX-E,歷�(jīng)�5代產(chǎn)品,兆芯都還沒有給CPU加上三級緩存。還有那個可笑的VendorID——CentaurHauls,在兆芯的桌面CPU上已�(jīng)掛了10年。連海光CPU的VendorID都改成了HygonGenuine,兆芯卻不忘�。不過有些令人擔(dān)心的是,海光也無法再向AMD購買更新更好的核�,兆芯的今日是否是海光的明日猶未可知�
飛騰D2000最�(yōu)秀的地方是功�,它�25W的TDP達到了比兆芯70W的TDP略好的性能。飛�D2000的功耗也要比龍芯3A5000�35W典型功耗更�,且多核性能比龍�3A5000略高,畢竟是8核跟4核作比較,總不能一點優(yōu)勢都沒有�
盡管4核的龍芯3A5000多核性能只是�8核的兆芯和飛騰桌面CPU相當(dāng),但在桌面應(yīng)用中,單核性能高就是優(yōu)�。桌面應(yīng)用中的流暢度�海光3250與龍�3A5000大約�2代酷睿i5、i7臺式機差不多,兆芯KX-U6780A和飛騰D2000就只能和凌動平板電腦相提并論�。龍芯在6000系列才終于放下了4核打8核的�(zhí)��3A6000�4�8線程�3B6000就是8核了(大小核�(shè)計)�3A6000�(yù)計單核及多核性能都超過i5-6500,與6�7代酷睿i7桌面CPU的性能相當(dāng)�3B6000的單核及多核性能大約都能超過AMD R5-2600吧�
{C}00001. {C}超線程在高負(fù)載時實際提升約為0%~20%,部分情況下造成�(fù)增長�
在某些測試中,超線程可提�50%以上的效�,因此造成了超線程可以�1個物理核心當(dāng)�1.5個來用的印象。然而提�50%算是特例,實際上平均來看是不可能達到那么高的�
超線程的加速能力和程序的計算類型有�(guān)、和程序?qū)�?nèi)存帶寬的需求有�(guān)、也和超線程的技�(shù)方案有關(guān)。使用涵蓋面較廣�SPEC CPU 2006&2017來測�,可以得出超線程對效率的平均提升幅度�0%~20%的結(jié)��
Intel i9-10850k的超線程加速比最�,并且在SPEC CPU 2006�2017的浮點多任務(wù)測試中都出現(xiàn)了負(fù)增長,這能說明Intel的超線程技�(shù)最差嗎?這種笑話不能信,真正的原因應(yīng)該是Intel i9-10850k�20個線程,同時運行20個任�(wù),內(nèi)存帶寬成為了瓶頸。R5-5600G在SPEC CPU 2017的浮點多任務(wù)測試中也同樣出現(xiàn)了負(fù)增長,也能證明雙通道DDR4-3200這時已經(jīng)達到了極限�
桌面CPU不管有多少個核�,一般都只共享兩個內(nèi)存通道,這也是桌面CPU不能替代服務(wù)器CPU的主要原因之一�
前面提到多任�(wù)并行�,內(nèi)存性能會成為瓶�,服�(wù)�CPU必須有更多的�(nèi)存通道。但�(nèi)存頻率和通道�(shù)并不等價于內(nèi)存訪問速度� CPU中還有一個重要的組成部分是內(nèi)存控制器��(nèi)存控制器和內(nèi)存是“誰慢誰有�”的關(guān)�。比�DDR4-2666雙通道理論帶寬上限超過40GB每秒,但國產(chǎn)CPU中的�(nèi)存控制器目前都達不到理論帶寬的的�(nèi)存訪問速率�
Linux下測試內(nèi)存訪問速率通常是使用Stream測試軟件,它也是以源碼方式提�,根�(jù)編譯參數(shù)不同而得到支持單線程和多線程測試的兩種版本。通常使用GCC編譯器的“-O”�“-O2”作為基礎(chǔ)編譯參數(shù),如果使用GCC�“-O3”參數(shù),對x86架構(gòu)CPU的內(nèi)存復(fù)制性能會有加成�
�(nèi)存訪問速率除了受限于內(nèi)存控制器的實�(xiàn)以及CPU與內(nèi)存的時序匹配之外,還與應(yīng)用程序有密切�(guān)系。沒有任何正常的軟件會只讀寫內(nèi)存而不干點別的事情,像Stream這種�(nèi)存的帶寬測試軟件也是如此。Stream是在模擬普通應(yīng)用軟件訪問內(nèi)存的方式——在循�(huán)中讀寫數(shù)�,不像AIDA64那種�(zhí)著于帶寬極限,因�Stream測試得到的內(nèi)存訪問速率總是低于理論峰�。不過只要內(nèi)存控制器效率越高�Stream訪問�(nèi)存的速率也一定越��
下面是用Stream�8款CPU訪問�(nèi)存速率的測試結(jié)果,分別測試了單通道-單線�、單通道-多線�、雙通道-單線�、雙通道-多線�。編譯參�(shù)使用了能代表大多�(shù)軟件�“-O”,對雙通道的情況又增加了對x86架構(gòu)有加成的“-O3”參數(shù)。�8款CPU都是桌面CPU,但因為同系列的服務(wù)器CPU使用的內(nèi)存控制器一般也相同,只是增加了通道�(shù)�,所以通過下表中的測試�(jié)果也能估計它們對�(yīng)的服�(wù)器CPU訪問�(nèi)存的效率�
所有的stream測試項目,兆芯KX-U6780A和飛騰D2000的速率都比體海�3250和龍�3A5000要低。如果只看在使用“-O”作為基礎(chǔ)編譯參數(shù)時的�(nèi)存復(fù)制效�,兆芯KX-U6780A和飛騰D2000在單通道和單線程時的�(nèi)存訪問性能甚至只有海光3250和龍�3A5000的一半左�。兆芯KX-U6780A甚至�“雙通道-多線�”時的�(nèi)存訪問速度也只有海�3250和龍�3A5000的一半左��
下圖是在使用“-O3”參數(shù)之后,各CPU“雙通道-多線�”�4種測試項目的�(nèi)存訪問速度。當(dāng)使用“-O3”作為基礎(chǔ)編譯參數(shù)�,所有x86 CPU的內(nèi)存復(fù)制的性能都有大幅度提升,但另外三項測試的速度沒有明顯變化�
從海�3250、AMD R5-2600、AMD R5-5600G的測試情況來看,AMD Zen和Zen3核心各自配套的內(nèi)存控制器差距還是比較明顯�。龍芯自主設(shè)計的�(nèi)存控制器也只是比兆芯和飛騰的更好,但與AMD及Intel還有相當(dāng)大的差距。據(jù)介紹下一代龍�6000系列已經(jīng)補上了DDR4�(nèi)存控制器的短�,達到了DDR4-3200�(nèi)存的理論帶寬,也就是說stream測試的內(nèi)存訪問速度�(yīng)該和上表中AMD R5-5600G及Intel i9-10850k的測試結(jié)果近��
UnixBench不是CPU測試工具,它測試的是最小整機系�(tǒng)的綜合性能。最小整機系�(tǒng)就是由CPU、主�、硬�、內(nèi)�、操作系�(tǒng)�(gòu)成的可以啟動的完整系�(tǒng),如果要測試UnixBench Graphics,那么還可以算上顯卡。我們此次不測試Graphics,因為GPU是一個很大的變量�
UnixBench主要是測試一臺電腦處理日常事�(wù)的效率,包括文本處理、浮點函�(shù)、文件讀�、進程�(chuàng)�、管道通信、腳本執(zhí)�,這些都是�(yīng)用軟件和操作系統(tǒng)常用的功能。因為所有功能的�(zhí)行都與CPU有關(guān),所以它的測試成績也與CPU性能有直接關(guān)�。但是操作系�(tǒng)如果對創(chuàng)建進程、管道通信等等功能進行�(yōu)�,也能提高測試成績,因此UnixBench是既測試CPU也測試操作系�(tǒng),內(nèi)存和硬盤性能也占了一定的比重�總體上看,UnixBench的測試成績代表的是電腦執(zhí)行日常任�(wù)的流暢程��
UnixBench的測試也分為單任�(wù)和多任務(wù),不過單任務(wù)中有一項是多腳本并行測�,會分派到多個核心上同時運行,因此UnixBench的單任務(wù)不是純粹的單核任�(wù)。UnixBench和SPEC CPU一樣也�“作弊”�(yōu)化的手段,但老夫偏不許它們使��
Intel i9-10850K無論是單任務(wù)還是多任�(wù)的成績都一騎絕�,緊隨其后的是AMD 5600G,再之后就是海光3250和AMD R5-2600��龍芯3A5000的單任務(wù)成績和AMD R5-2600是同一檔次,比海光3250和Intel i5-6500還高一�,但多任�(wù)成績就只能和兆芯KX-U6780A、飛騰D2000、Intel i5-6500歸為同一檔了。不過龍�3A5000和Intel i5-6500只有4個核心,兆芯KX-U6780A和飛騰D2000�8個核�,也不知道誰會更加尷��
其實兆芯KX-U6780A和飛騰D2000在UOS系統(tǒng)中的的測試成績相對一年前已經(jīng)提高了很�,因為最近一年UOS系統(tǒng)做了大量�(yōu)�,帶來的附加效果就是UnixBench的多任務(wù)測試成績都提高了1000分左�,龍�3A5000的UnixBench多任�(wù)測試成績也提高了�500分�
為了驗證成績提升確實來自�UOS系統(tǒng)�(yōu)��我用Ubuntu 22測試了KX-U6780A的UnixBench成績,單任務(wù)僅有678.1�,多任務(wù)也僅�3156.1�,而在UOS系統(tǒng)中的測試成績分別�962.3�4764.7�,說明UOS系統(tǒng)的日常應(yīng)用流暢程度遠(yuǎn)高于Ubuntu�只不過這些�(yōu)化對SPEC CPU用處不大,各種純計算的任�(wù)主要還是依賴CPU本身的性能�
目前國產(chǎn)CPU的性能與主流產(chǎn)品還有明顯的差距,因為CPU頻率的差距,即使的海光和龍芯CPU的單核性能也只有主流中高端CPU的一半左�,兆芯和飛騰則幾乎沒有對比的價值�
在當(dāng)�,國�(chǎn)CPU中海光的性能最�,龍芯在與海光的核心�(shù)量相同時性能差距甚小,飛騰和兆芯的桌面產(chǎn)品只能用8核逼平龍芯4�,頗為無�。國�(chǎn)CPU中龍芯的成長能力最�,單核性能達到或超過R5-2600和i5-6500 的產(chǎn)品今年底或明年初就能供貨,而IPC則能達到AMD Zen3和Intel酷睿12代的水準(zhǔn)�
X86架構(gòu)的軟件生�(tài)最完備,ARM和LoongArch在Linux上的軟件生態(tài)是半斤八�,龍芯的二進制翻譯暫時還不能完全彌補與x86的生�(tài)差距�
國產(chǎn)CPU的性價比很�,但既然已經(jīng)在討論性價比了,那就說明國�(chǎn)CPU的性能已經(jīng)可以用了,至少海光和龍芯是可以用��
海光CPU是引進技�(shù)的代表,既有性能又有生態(tài),只是海光未來提升性能可能和兆芯飛騰一樣艱�;龍芯CPU是自主設(shè)計的代表,海光是龍芯即將跨過的最后一道門�,今年過后龍芯CPU的性能在國�(chǎn)中必定一騎絕�,軟件生�(tài)也更趨完�。龍芯將能全力追趕Intel和AMD——超越它們是龍芯的執(zhí)��
本文圖表�8款CPU的所有測試數(shù)�(jù),均為老夫?qū)崪y,若需查看SPEC CPU、UnixBench的原始測試報�,請移步下方截圖中所示地址�