過去的兩年里,研華著手布局AIoT解決方案,將自己定位為一個全面的人工智能平臺解決方案提供商。為此,研華推出了從1U到4U的各種機架式GPU服務器。近期,研華發(fā)布了新款4U機架式高密度GPU服務器SKY-642,一款支持適用于人工智能訓練端的GPU卡。
研華SKY-642-4U高密度GPU服務器
研華的SKY-642 4U高密度GPU服務器的設計是結(jié)合大數(shù)據(jù)收集和分析的發(fā)展趨勢。
●支持多達10個Nvidia v100 32GB PCIe卡,具有點對點功能,確保每個GPU之間的最大頻寬和最短的延遲;
●前置的12x 2.5”/3.5”硬盤盤位最大程度上提升服務器存儲能力;
●IPMI監(jiān)控系統(tǒng)包括10個GPU卡和HDD狀態(tài),智能風扇控制通過有效溫度調(diào)節(jié),確保SKY-642中10個 GPU的穩(wěn)定性。
GPU之間的快速點對點通信
在深度學習和大數(shù)據(jù)分析領域,應用程序需要更多與可擴展性并行工作的GPU功能。通過采用均衡負載模式,SKY-642實現(xiàn)了點對點功能,縮短了GPU卡之間的延遲,同時加快了計算時間。
更好的散熱和系統(tǒng)風扇設計
自SKY-642開始設計滿載10個GPU卡,散熱是一個重要的問題。采用一個雙層熱插拔系統(tǒng)風扇增加了風流和氣壓,用于冷卻10個雙層GPU卡時,近似的無線設計提高了系統(tǒng)的效能。一個專為CPU和GPU設計的單獨空氣通道,確保所有的GPU卡不是由CPU預熱。這使得系統(tǒng)風扇控制比以往任何時候都更智能——單獨的風扇區(qū)域根據(jù)GPU和CPU的最大負載分別控制每個系統(tǒng)風扇。風扇控制降低了不同工作負載下SKY-642的聲學性能。
智能平臺管理界面
在IPMI 2.0規(guī)范支持下,SKY-642允許用戶監(jiān)視、管理和控制遠程服務器。用戶可以監(jiān)控傳感器,并在任何傳感器發(fā)生故障時接收警報。受監(jiān)控的傳感器跟蹤服務器中使用的GPU卡的溫度,并管理事件日志以找出重要信息。通過使用IPMI KVM或電源控制來實現(xiàn)遠程服務器控制,以使服務器能夠通電/斷電和進行電源循環(huán)。
(轉(zhuǎn)載)