Tag Archives: AI伺服器

伺服器散熱效能不佳有解嗎?專家建議這麼做
伺服器散熱效能不佳有解嗎?百佳泰專業團隊為您解 (二)

前篇文章中『伺服器散熱效能不佳有解嗎?專家建議這麼做』提到氣冷式的伺服器其散熱效能對於系統穩定度是非常重要的關鍵因素,同時也說明了百佳泰對於散熱效能能提供的協助與服務。 本篇將為您延伸說明百佳泰如何進行評估,同時也會舉例在測試過程中發現的問題及改善後的數據。 AI伺服器的散熱架構三大重點: GPU導風罩:嘗試不同的GPU導風罩架構,用以集中伺服器進風量,加強對GPU的降溫效果。 GPU托盤:改動GPU托盤架構,驗證出風面積大小對GPU散熱的影想程度。 CPU導風罩:嘗試封閉CPU導風罩間隙,集中風流,驗證CPU降溫效果。 百佳泰專業技術團隊會先與您討論現況,並實際確認散熱架構後,將開始進行溫度監控的熱電偶佈點,完成佈點後,開始執行加壓程式及溫度數據的收集。加壓過程中會有不同部件的加壓(ex. GPU or CPU)及加壓的程度 (ex. 30%~100%),同時也會嘗試對風扇的轉速控制或製造風扇的故障來模擬各種情境以收集相關的數據做分析,以確保伺服器在遇到突發狀況時仍能夠保持散熱的穩定性。 百佳泰針對此專案嘗試了兩個散熱架構的數據收集,經過分析後確認散熱架構1的表現較符合預期,測試結果如下圖: 在數據收集的過程中,我們也發現了一個異常的現象,在收集PSU佈點的電熱偶數據中發現:溫度的曲線並非是越靠近中心溫度越高,有兩個點呈現相反的狀態。經過分析、與客戶討論後找出其實際原因是因為熱風回流所導致,而發生的地方就是在PSU附近的機殼側面或縫隙。數據資料及過程如下: 改善前PSU溫度異常 [...]

伺服器散熱效能不佳有解嗎?專家建議這麼做
伺服器散熱效能不佳有解嗎?專家建議這麼做

今年AI技術的話題不斷,隨著相關應用服務的陸續推出,AI的趨勢已經是一個明確的趨勢及方向,這也連帶使得AI伺服器的出貨量開始加速成長。AI伺服器因為有著極高的運算效能,伴隨而來的即是大量的熱能產生,因此散熱效能便成為一個格外重要的議題。其實不只AI伺服器有著散熱的問題,隨著Intel及AMD 的CPU規格也不斷地在提升,非AI應用的伺服器的散熱問題也是不容小覷的潛在問題。即便如此,由於目前的液冷技術仍有許多待克服的地方,舉凡像是建置成本昂貴,機殼、軌道、水路、資料中心等項目都得重新設計來過,維修人員也得需要時間重新訓練。因此目前市面上出貨的伺服器大多數還是以氣冷式為主。   一站式客製化顧問諮詢,有效改善伺服器散熱效能 氣冷式的散熱架構及散熱料件將決定伺服器的散熱效能。當散熱效能不夠好時,伺服器的溫度將會持續升高,若此時機房的冷氣無法有效地降低溫度時,將會導致伺服器因溫度過高而啟動保護措施,包括降速或強制關機。當保護措施啟動時,對外的影響就是應用服務效能降低,使用者感覺回應變慢,甚至是因強制關機而導致的服務中斷等等,這些都會造成使用者的負面體驗。 在伺服器散熱效能的評估上,百佳泰除了具備豐富的實務經驗及專業的技術團隊,可協助進行不同散熱架構的建置及數據收集,提供客戶不同散熱料件的全面性分析與評估。依據伺服器產品需求的不同,百佳泰能提供一站式的客製化顧問服務、,涵蓋了如機構、電性、並搭配高頻領域的環測項目。除此之外,在服務過程中對於產品的各種系統介面、指令操作、軟體更新、硬體更換等測試細節,百佳泰不僅擁有相關的技術能力與執行經驗,更可提供相關的測試建議與諮詢,進而滿足客戶的各項需求。   舉一個專案的例子來說,百佳泰協助該客戶更換不同的散熱料件,並將收集到的數據整理後提供給客戶,客戶即可透過百佳泰所提供的測試數據,選擇出最佳搭配的散熱模組。收集不同散熱材料的數據,CPU最高的溫差可達5度,客戶由此可得知不同料件,對散熱效能影響的差異。   或者像下圖這個專案,經過散熱架構的選定、微調以及散熱材料的選擇後,百佳泰成功將將整體伺服器的溫度下降約9.3°C,達到客戶要求的標準。   Faster, Easier, Better!值得您信賴的檢測技術顧問 百佳泰深耕IT領域,至今已累積超過30年的測試驗證經驗,透過全面性的智慧檢測建議與分析,百佳泰能替伺服器相關產品客戶帶來全方位的客製化解決方案,致力打造更快速、更高效,同時更加完善的一站式顧問諮詢服務,與客戶一同為產品品質進行嚴格把關。 [...]

效能優劣絕非嘴巴說了算!深度解析SSD在真實使用者情境下的實際負載表現
效能優劣絕非嘴巴說了算!深度解析SSD在真實使用者情境下的實際負載表現

除了效能數據,SSD效能穩定度也同等重要 在SSD( 固態硬碟)已經普及化的現在,相信只要曾經使用過SSD系統的使用者,都能體會到SSD有別於傳統HDD的高速讀寫效能。目前一般SSD廠商大多使用固定且制式化的效能測試方式來宣稱其效能卓越。對於廠商以及消費者來說,通常只能單憑效能數據的高低做為選購上的參考依據。 雖然效能數據的高低對於使用者來說絕對有其重要性,但對於高頻率的使用者來說,SSD的效能穩定度往往是另一個更值得觀察的重要指標。畢竟在一般用戶的使用情況下,又或者是在伺服器中的運作情形,都不會是只有固定的連續/隨機讀取,往往還會有不同資料大小以及host端發出的不同序列深度,而這些都會大大地影響SSD的效能表現。換句話說,固定制式的效能測試結果雖然可以帶來單純的效能數據比較,但對於要在複雜且多樣化的使用環境下進行效能評估,我們並無法直接地從該測試結果得出結論;更別說在現今需求激增的影音創作及遊戲競技需求的使用者情境中了。當消費者越來越看重SSD的效能穩定度,那麼廠商就更加不能只想從傳統簡單的驗證方法來尋求解答。   使用者情境實例分享:SSD在真實使用者情境下的實際負載表現 憑藉多年來與各大廠商合作的豐富經驗以及專業能力,百佳泰的顧問團隊發現,若要獲得貼近實際安裝在系統上的效能數據,可以考慮另一種更貼近使用情境的檢測方式 – 「實際負載效能測試」。 首先,我們必須要先知道該特定環境的實際讀寫情形分佈為何,我們可以透過IO trace的方式,針對特定的應用情境,實際從旁側錄其工作情形,並將其實際負載過程內容透過資料分析及解析其讀寫分佈。經由這套效能分析程序,我們便可針對不同使用環境下的SSD實際讀寫情況進行分析。一般大眾較常見的使用情境通常會有線上影音剪輯與編輯、執行電腦遊戲、文書處理辦公、IT人員編輯程式、工作站大型影像編輯處理以及學生日常使用等等,接下來我們將透過兩個時下最為熱門的使用者情境,與大家進行實際案例的分享。   線上影音創作者:SSD Random Write(隨機寫入)需求高 [...]