您的位置:首頁 > 服務器硬件技術

                                            ARM服務器之戰即將爆發:AWS正面對陣微軟

                                            發布時間:2022-04-13 22:53:37  來源:IT資訊網    采編:author  背景:

                                            誰能想得到,最終愿意在超大規模云平臺上堅守x86架構的,居然很可能是谷歌。

                                            亞馬遜云科技過去幾年來一直努力推動其Graviton產品線,包括去年3月開始生產的Graviton 2,以及去年11月公布、目前仍處于預覽非量產狀態的Graviton 3芯片??傊?,AWS各大區域與數據中心正在全面迎接ARM新勢力的到來。

                                            如今,微軟也開始在Azure云上發布新實例(同樣為預覽版),顯然也想在ARM服務器芯片領域一展身手。這些實例基于Ampere Computing制造的80核心“Quicksilver”Altra Arm服務器芯片,這款芯片最初公布于2020年6月,能夠以3 GHz最高主頻容納80個計算核心。雖然由Ampere Computing Altra處理器支持的全新Azure D系列與E系列實例引發了不少關注,但讓人奇怪的是微軟為什么不提前一年甚至更早就著手發布,也不清楚微軟為什么不使用原定于2020年第四季度提供樣品、去年秋季正式供貨的128核“Mystique”Altra Max開發新實例。但無論如何,Mystique處理器能夠與微軟目前部署的Quicksilver芯片實現插槽兼容,所以微軟也完全可以根據需求將Altra Max芯片快速接入供應鏈、服務器及其數據中心。

                                            有心的朋友可能還記得“Siryn”芯片,也就是采用Ampere Computing“A1”原研核心的芯片方案。我們對它已經基本失去期待,畢竟它不太可能使用Altra品牌,而且“A1”這個名稱也不符合市場受眾對技術及最終產品的期待——枯燥乏味的名稱往往令人們失去關注和討論的興趣。而且縱觀Ampere Computing的整個計算路線圖,我們會發現超大規模企業和云服務商想要的是完整的技術體系、而非特定某款芯片產品。甲骨文、騰訊、阿里巴巴乃至微軟等都想為自己的公有云選擇最合適的芯片,而Ampere Computing方面目前值得期待的將是搭載A2核心的下一代芯片。這款新品預計將在2023年推出。

                                            但推出跟批量出貨完全是兩個概念,只要超大規模企業和云服務商沒法立刻把這款芯片放進云端上萬臺服務器,那Ampere Computing的一切路線圖就仍然只是空談。量產、認證與機房建設都需要時間,所以數據中心里這些架構層面的階段性變化還需要五到十年才能轉化為實際影響。話雖如此,目前的ARM服務器芯片確實是形勢一片大好,只要不出特別大的意外、ARM公司當初定下的20%到25%的市場占有率目標應該沒啥問題。

                                            微軟的態度也是相當明確,全力支持ARM服務器芯片在Azure云上遍地開花。在2017年開放計算峰會的演講中,微軟就提到希望讓ARM服務器在全部服務器算力容量中占比達到50%。但當時的微軟還沒有承諾在Azure云基礎設施中直接提供ARM算力(只在平臺云和軟件云部分向用戶提供微軟軟件訪問權限),也沒提到在ARM上發布Windows Server堆棧(但微軟一直在內部使用Windows on ARM運行Azure上托管的原生應用程序)。另外,微軟在這場峰會上還公布了“Project Olympus”,以預覽形式展示了這些服務器上的Cavium ThunderX芯片與高通Centriq芯片。但隨后幾年情況大變,高通取消了Centriq產品線,Cavium則被Marvell收購、ThunderX3同樣很快被拋棄。這就迫使微軟不得不自主設計、或者借Ampere Computing之手開發ARM服務器芯片。目前,不少行業分析師認為微軟會采取雙管齊下的研發思路。

                                            那么,Azure當中到底部署了多少ThunderX2芯片?我們估計不會太多,否則Marvell怎么會停掉這塊可觀的業務版塊。Azure中又有多少Ampere Computing Altra設備?應該要比ThunderX2多得多??傊?,微軟正在云基礎設施上提供ARM算力,主要用于運行虛擬機內的Linux操作系統。但據我們所知,Windows Server目前還沒有登陸ARM平臺,而且一旦登陸將給服務器計算架構帶來深遠影響。有了這些背景,再參考微軟在聲明中強調的“不會坐視AWS在定義數據中心內的未來ARM服務器方面一家獨大”,接下來的局面就已經相當清晰了。

                                            關于微軟的ARM AZURE實例

                                            目前微軟的Quicksilver ARM實例尚處于技術預覽階段,所以我們對細節了解不多。不過一旦Quicksilver與AWS Graviton 3實例卸下這層神秘的面紗,接下來我們肯定要對這兩種ARM服務器實例進行價格/性能分析,同時橫向對比兩家x86實例的銷售情況。下面,我們還用目前已知的參數信息整理出一份表格,用以比較各實例的配置、速度與價格??梢钥吹?,微軟已經公布了接下來六種ARM服務器實例類型的基本參數:

                                            首先,每芯片提供8個DDR4內存控制器,意味著Altra CPU能夠支持遠超當前配置水平的內存容量。ALtra CPU還支持NUMA集群,可用于創建更大的內存地址空間與計算引擎。目前還不清楚這些Azure實例屬于單插槽還是雙插槽設計。

                                            關于我們另外一個好奇的點,微軟同樣沒有給出答案,這就是既然Altra芯片最多可以支持80核,但為什么新的實例只分別提供32核與64核?也許是因為這些實例用的都是單插槽服務器,而且對應的系統沒有DPU來分擔網絡與存儲虛擬化負載,所以只能劃出一部分核心運行管理程序堆棧。當然,微軟服務器也有可能配備有DPU,只是32核與64核是Ampere Computing芯片的最佳性價比區間。無論如何,實際情況應該就是這兩種之一。(當然,也有可能是因為ARM上Hyper-V虛擬機管理程序的運行效率確實低下,那就是二者兼而有之。)

                                            為了幫助大家了解不同Azure ARM服務器實例間的SKU區別,我們整理出下面這張表,同時列出各按需實例的每小時使用成本。(微軟也公布了競價實例價格,但在跨云服務商比較中沒什么參考意義,故而省略)。在表中,我們以三年為期計算了超大規模企業與云服務商的實例運行成本,再使用最終得出的結果進行跨云及云內價格/性能比較。(但考慮到目前云端服務器的平均壽命,取四年為期可能更準確。)

                                            Azure上的實例價格跟虛擬CPU(vCPU)數量成線性關系,至少在目前的產品線上看是這樣。但底層芯片的成本不可能如此線性,各個實例在特定工作負載上的絕對性能也不會線性擴展。因此,不同實例中的價格/性能表現并非恒定。

                                            根據微軟的說明,其中Azure Dpsv5系列實例主要用于運行Web服務器、應用程序服務器、Java與.NET應用程序、開源數據庫以及游戲與媒體服務器。Dpsv5實例每核心支持4 GB內存,不提供本地磁盤;而Dpdsv5實例每核心同樣支持4 GB內存,同時提供隨核心數量擴展的本地存儲容量。Dplsv5實例每核心支持2 GB內存,Dpldsv5也一樣,只是后者提供本地存儲容量。所有這四種實例類型都能從2核擴展至最大64核。而Epsv5實例雖然每核心配備8 GB內存,但最大只能擴展至32核心,而且要到Epdsv5實例才提供本地存儲。(建議大家盡快熟悉這些名稱,之后我們會反復提及。)

                                            不提供本地存儲的實例自然價格更低,而且微軟在Azure上提供的各類外部閃存選項也都適用于這些ARM實例。各實例提供2到8個網絡接口。微軟表示,這些接口可帶來“高達40 Gb/秒”的網絡連接,相信這里的指標肯定是以虛擬NIC衡量的結果。虛擬NIC數量可能跟各虛擬NIC的傳輸帶寬成反比,我們猜測每臺物理服務器的傳輸通道最大為100 Gb/秒。但如果設有兩個以太網端口,那最大傳輸帶寬就是200 Gb/秒。具體如何,還要等預覽階段結束后才能確定。

                                            這里還有個值得關注的重點,我們已經跟Ampere Computing多次討論過這個問題、也從AWS的Gravtion系列芯片那邊聽到過類似的說法:一組具有靜態時鐘速率的真實核心,其性能確定性會優于一組具備可變時鐘速率的虛擬核心。

                                            Ampere Computing Altra芯片不提供同時多線程(SMT),所以vCPU就是真實存在的CPU核心。而且Altra芯片各核心的時鐘速率是鎖定的,也就沒有根據特定時間內核心用量調節的可變時鐘速率。另一方面,云端服務器的常規用例就是以無數種方式進行拆分,在同時支持大量客戶時讓每個核心都保持一定的運行強度,這意味著某個或某組核心不太可能長時間保持超頻。所以Ampere Computing明顯是聽取了超大規模企業及云服務商的意見,決定讓CPU性能更具確定性。所以Altra芯片會保持時鐘速率恒定,而不再為核心采用可能導致爭用的虛擬線程技術。

                                            但以上結論也只應用于特定場景。對于高性能計算(HPC)工作負載,運營人員一般會關閉SMT,否則虛擬線程帶來的管理開銷反而會降低整體性能。對于占用大量線程的工作負載(例如事務處理監控器與關系數據庫),由于各核心緩存之間并不存在太多爭用問題,所以沒必要畫蛇添足引入虛擬線程。根據多年以來的實踐經驗,對于HPC類工作負載,同樣屬于SMT的英特爾超線程(HT)技術很可能令性能下降10%到20%。但采用IBM“Cumulus”Power 10處理器的Power E1080服務器又有所不同。根據IBM的rPerf基準測試(屬于TPC-C在線事務處理測試的I/O未綁定變體),這套全尺寸240核系統的相對性能得分為2250.8,其中每個核心對應一個線程。而隨著虛擬線程的開啟——即每核2個線程、4個線程乃至最終8個線程——其性能也隨之擴展2倍、2.8倍和3.6倍(其中SMT4每核4線程的性能提升明顯不如SMT8每核8線程)。

                                            關鍵在于,SMT會帶來極為復雜的影響,而且大多數使用x86架構的云實例都會默認啟用,用以提高vCPU密度。SMT確實能為實例提供更多切片與SKU單元,這就讓實例層面呈現出的服務器資源比x86 CPU實體更豐富。但我覺得云服務商最好能開誠布公,允許客戶靈活選擇SMT或者裸機選項。

                                            現在,我們繼續聊性能。在關于ARM架構Azure實例的官宣博文中,Azure計算平臺產品負責人Paul Nash表示,“新的虛擬機系列實例包含通用型Dpsv5以及內存優化型Epsv5,其價格/性能比較同級別x86虛擬機高出達50%?!?/p>

                                            但這個結論還是太過模糊,畢竟其中比較的是“價格/性能比”、而非單一具體產品。因此,我們在上表中調整了微軟Azure實例的比較信息。

                                            無論如何,微軟在聲明中并沒有提供太多關于性能或者價格/性能比的具體信息。

                                            Ampere Computing公司首席產品官Jeff Wittich則就聲明做出解釋,“Ampere Altra VM的性能分別比同代、同級別英特爾與AMD實例高了39%與47%。*除了性能更高,Ampere Altra處理器還非常節能,可幫助用戶顯著減少總體碳足跡?!?/p>

                                            原文中的星標腳注為:“結論來自運行在Ubuntu 20.04 LTS系統上、且兼容gcc 10.2.1, -O3, -mcpu=native, JEMalloc的D16ps v5, D16s v5, D16as v5 Azure虛擬機(基于SPEC CPU 2017 整數運算)?!?/p>

                                            明確了一些,但還不夠好。SPECrate是CPU領域常用的吞吐量整數測試。對于基準結果,所有SPEC模塊都應使用相同的編譯器標志進行編譯,同時需要在結果中包含一項峰值。測試人員需要運行SPEC測試的多個副本,查看芯片能夠承載多大的事務吞吐量。通過SPECspeed2017測試,套件中各基準測試的副本都將在一系列不同條件下運行,由測試人員根據OpenMP選擇要使用多少線程,最終得出的結果則以時間為度量、代表整個基準測試在多長時間內能夠運行完成。

                                            我們就此事聯系了Wittich,反映目前微軟的表述太過模棱兩可。他則向我們提供了Ampere Computing所發布的、在Azure博文中用到的實際數據:

                                            下表所示,為各實例的原始SPECrate2017整數性能。這些實例分別使用AMD、英特爾以及Ampere Computing提供的最新CPU,同時參考了各實例的每小時運行成本。為了體現各組數字的相對大小,Wittich用性能除以成本,結果就是三者在同等成本下所能提供的SPEC整數運算吞吐量。

                                            這里要澄清一下,上表中的“Altra D16pdv5”為筆誤,實際應該是Altra D16psv5實例。微軟,你看看自己起的這些實例名稱……

                                            這里我們更關注每單位性能對應的成本,畢竟性能需求往往是硬性的,先要明確需要多少性能、再算得花多少錢。為此,我們計算出三種Ampere Computing實例以三年為期(無折扣)的整數運算測試結果:

                                            既然打算在云實例中長期運行負載,那最好能對成本有所把握。這里得到的百分比跟Wittich的計算結果相同。如果我們把AMD和英特爾芯片上的SMT功能關閉,又會有什么不同?這個還是要分情況,如果大家對vCPU數量有硬性要求,那關閉之后您可能只能購買兩倍大小的AMD和英特爾實例。這樣雙方的核心更強大、性能更強,但同時也失去了跟Ampere Computing比較的意義。

                                            我們覺得更合理的方式,應該是回歸具有8個真核心的AMD和英特爾芯片,再把性能提升個10%到20%,再重新計算性能價格比。如此一來,AMD“Milan”Epyc 7003實例的SPECrate整數性能將介于50.8到55.4之間,英特爾“Ice Lake”至強SP實例的SPECrate整數性能則介于53.7到58.6之間。Altra實例仍然保持價格優勢——比Milan低10.5%,比Ice Lake低19.8%;同時還是擁有更高的性能水平——比Milan高23%到34.2%,比Ice Lake高16.5%到27%。因此,Altra芯片的性價比依舊突出,其每單位性能的對應成本要比競爭對手低三分之一左右。

                                            而谷歌之前曾經說過,只要有20%左右的性價比優勢空間,他們就愿意改變CPU架構。

                                            最后一點:微軟目前在ARM實例上支持Canonical Ubuntu Linux、Cent OS以及Windows 11專業版與企業版,未來還將支持Red Hat Enterprise Linux、SUSE Linux Enterprise Server、Debian、AlmaLinux以及Flatcar,但并沒有提到Windows Server。

                                            我們期待看到AWS Graviton與Azure Altra實例的性能數據對比,這才是接下來的重頭戲。亞馬遜與微軟兩大巨頭終于要正面開戰了,孰優孰劣讓我們拭目以待。

                                              聲明:本文僅為傳遞更多網絡信息,不代表IT資訊網觀點和意見,僅供參考了解,更不能作為投資使用依據。


                                            返回網站首頁 本文來源:IT資訊網

                                            本文評論
                                            邊緣數據中心和5G的融合將如何徹底改變數據傳輸和物聯網
                                            邊緣數據中心和5G本身正在改變人們利用和使用數據的方
                                            日期:02-10
                                            出現許久的移動支付,為何遲遲不能普及
                                            為什么移動支付技術在問世多年后仍遲遲得不到普及?《連
                                            日期:03-16
                                            架構師訪談:后退一步才能看到更大的世界
                                            一位從業16年的軟件架構師,對這個行業的發展有什么看法
                                            日期:03-03
                                            如何理解HTTP協議的“無連接,無狀態”特點?
                                            是一個屬于應用層的面向對象的協議,HTTP 協議一共有五
                                            日期:03-07
                                            如何使用Backstab終止受保護的進程
                                            Backstab是一款功能強大的安全研究工具,在該工具的幫助
                                            日期:01-22
                                            一場定義to B市場未來的生態戰略發布會
                                            據了解,此次發布會上,包括用友超客、金蝶云之家、SAP、
                                            日期:02-17
                                            綠色數據中心建設加速液冷引領節能熱潮
                                            伴隨新基建的推進,數據中心作為推動數字經濟發展的算力
                                            日期:02-15
                                            升完iOS 12 我的舊iPhone還能再戰一年
                                            9月18日,每當蘋果發布新的手機,就會有個段子總被大家提
                                            日期:10-02
                                            重新認識訪問者模式:從實踐到本質
                                            本文不會執著于死板的代碼模板,而是直接從開源項目以及
                                            日期:03-04
                                            老板看了求你快住手!這款摸魚App太絕了
                                            今天,就來介紹一款可以讓電腦偽裝成系統升級狀態的摸魚
                                            日期:01-18
                                            術業有專攻,看戴爾如何在移動工作站領域大秀操作
                                            戴爾在筆記本領域深耕多年,旗下產品線分布也十分廣泛,廣
                                            日期:03-22
                                            英國倡議立法保護物聯網,但這真的能解決問題嗎?
                                            根據英國廣播公司的一篇文章,英國數字部長馬戈特·詹姆
                                            日期:04-09
                                             

                                            精品无码久久午夜福利