Category Archives: Server文章

伺服器SSD工作負載:一文看懂企業級SSD效能評估與驗證解析
伺服器SSD工作負載:一文看懂企業級SSD效能評估與驗證解析

AI應用浪潮襲來,伺服器運算及儲存效能的需求高漲 隨著人工智慧(Artificial Intelligence, AI)和機器學習(Machine Learning, ML)的爆炸性應用如雨後春筍般出現,這無疑對AI伺服器的儲存容量和儲存性能迎來空前的需求高漲。數據中心與企業級伺服器叢集必須持續追求更高的運算效能,同時更低延遲的高速傳輸,才足以因應海量資料運算存取的龐大商機。 不論是數據中心還是企業級伺服器叢集,都是由一台一台的伺服器所組成,並可概分為運算、儲存與網路等三大主要部分。由於伺服器本身目前的技術架構限制,導致運算速度(CPU, RAM)仍普遍遠快於儲存速度,因此各種研究及應用皆不斷地投入在儲存裝置上,以期能夠提升企業用伺服器的整體效能。其中「固態硬碟」(SSD)由於其本質上具備電子訊號讀寫、多通道存取特性,以及無傳統硬碟(HDD)的機械讀取限制等特性,這也使得固態硬碟的讀寫速度不僅比傳統的HDD快上許多,在耗電性上的表現也要來得更加出色。此外,受惠於NAND Flash製程技術近年來的不斷提升,再加上各項控制器、韌體技術改進可靠性及使用壽命後,資料中心的固態硬碟的使用量也不斷地隨之成長。   SSD效能驗證眉角多,委託專業顧團隊的效益更高 在進行SSD效能的驗證時,除了考慮資料吞吐量(Throughput)外,讀寫效能(IOPS, I/O Per Second)也務必是需要評估的一大關鍵。雖然坊間有不少評測軟體可以量測SSD產品的讀寫效能,但是不同軟體有各自的專長領域,要如何正確地使用評測軟體來評量SSD效能,並且能快速地針對問題進行改善及排除,此時就必須仰賴具備豐富驗證經驗的顧問團隊,提供專業的技術支援。 [...]

伺服器散熱效能不佳有解嗎?專家建議這麼做
伺服器散熱效能不佳有解嗎?百佳泰專業團隊為您解 (二)

前篇文章中『伺服器散熱效能不佳有解嗎?專家建議這麼做』提到氣冷式的伺服器其散熱效能對於系統穩定度是非常重要的關鍵因素,同時也說明了百佳泰對於散熱效能能提供的協助與服務。 本篇將為您延伸說明百佳泰如何進行評估,同時也會舉例在測試過程中發現的問題及改善後的數據。 AI伺服器的散熱架構三大重點: GPU導風罩:嘗試不同的GPU導風罩架構,用以集中伺服器進風量,加強對GPU的降溫效果。 GPU托盤:改動GPU托盤架構,驗證出風面積大小對GPU散熱的影想程度。 CPU導風罩:嘗試封閉CPU導風罩間隙,集中風流,驗證CPU降溫效果。 百佳泰專業技術團隊會先與您討論現況,並實際確認散熱架構後,將開始進行溫度監控的熱電偶佈點,完成佈點後,開始執行加壓程式及溫度數據的收集。加壓過程中會有不同部件的加壓(ex. GPU or CPU)及加壓的程度 (ex. 30%~100%),同時也會嘗試對風扇的轉速控制或製造風扇的故障來模擬各種情境以收集相關的數據做分析,以確保伺服器在遇到突發狀況時仍能夠保持散熱的穩定性。 百佳泰針對此專案嘗試了兩個散熱架構的數據收集,經過分析後確認散熱架構1的表現較符合預期,測試結果如下圖: 在數據收集的過程中,我們也發現了一個異常的現象,在收集PSU佈點的電熱偶數據中發現:溫度的曲線並非是越靠近中心溫度越高,有兩個點呈現相反的狀態。經過分析、與客戶討論後找出其實際原因是因為熱風回流所導致,而發生的地方就是在PSU附近的機殼側面或縫隙。數據資料及過程如下: 改善前PSU溫度異常 [...]

伺服器散熱效能不佳有解嗎?專家建議這麼做
伺服器散熱效能不佳有解嗎?專家建議這麼做

今年AI技術的話題不斷,隨著相關應用服務的陸續推出,AI的趨勢已經是一個明確的趨勢及方向,這也連帶使得AI伺服器的出貨量開始加速成長。AI伺服器因為有著極高的運算效能,伴隨而來的即是大量的熱能產生,因此散熱效能便成為一個格外重要的議題。其實不只AI伺服器有著散熱的問題,隨著Intel及AMD 的CPU規格也不斷地在提升,非AI應用的伺服器的散熱問題也是不容小覷的潛在問題。即便如此,由於目前的液冷技術仍有許多待克服的地方,舉凡像是建置成本昂貴,機殼、軌道、水路、資料中心等項目都得重新設計來過,維修人員也得需要時間重新訓練。因此目前市面上出貨的伺服器大多數還是以氣冷式為主。   一站式客製化顧問諮詢,有效改善伺服器散熱效能 氣冷式的散熱架構及散熱料件將決定伺服器的散熱效能。當散熱效能不夠好時,伺服器的溫度將會持續升高,若此時機房的冷氣無法有效地降低溫度時,將會導致伺服器因溫度過高而啟動保護措施,包括降速或強制關機。當保護措施啟動時,對外的影響就是應用服務效能降低,使用者感覺回應變慢,甚至是因強制關機而導致的服務中斷等等,這些都會造成使用者的負面體驗。 在伺服器散熱效能的評估上,百佳泰除了具備豐富的實務經驗及專業的技術團隊,可協助進行不同散熱架構的建置及數據收集,提供客戶不同散熱料件的全面性分析與評估。依據伺服器產品需求的不同,百佳泰能提供一站式的客製化顧問服務、,涵蓋了如機構、電性、並搭配高頻領域的環測項目。除此之外,在服務過程中對於產品的各種系統介面、指令操作、軟體更新、硬體更換等測試細節,百佳泰不僅擁有相關的技術能力與執行經驗,更可提供相關的測試建議與諮詢,進而滿足客戶的各項需求。   舉一個專案的例子來說,百佳泰協助該客戶更換不同的散熱料件,並將收集到的數據整理後提供給客戶,客戶即可透過百佳泰所提供的測試數據,選擇出最佳搭配的散熱模組。收集不同散熱材料的數據,CPU最高的溫差可達5度,客戶由此可得知不同料件,對散熱效能影響的差異。   或者像下圖這個專案,經過散熱架構的選定、微調以及散熱材料的選擇後,百佳泰成功將將整體伺服器的溫度下降約9.3°C,達到客戶要求的標準。   Faster, Easier, Better!值得您信賴的檢測技術顧問 百佳泰深耕IT領域,至今已累積超過30年的測試驗證經驗,透過全面性的智慧檢測建議與分析,百佳泰能替伺服器相關產品客戶帶來全方位的客製化解決方案,致力打造更快速、更高效,同時更加完善的一站式顧問諮詢服務,與客戶一同為產品品質進行嚴格把關。 [...]

極速訊號之爭:驚世科技浪潮的競技場

現今科技世代,高頻傳輸和高速運算的需求和應用正以驚人的速度增長。這個現象主要歸因於數位化轉型、物聯網、人工智慧、5G等新興技術的迅速普及。這些技術的蓬勃發展正在深刻改變著我們的生活習慣和商業模式。 然而,這些高速需求也帶來了許多挑戰,尤其是在確保訊號完整度和品質方面。在高頻傳輸與高速運算過程中,訊號可能面臨許多問題,這些問題不僅可能影響訊號的準確性,並在後續的數據分析和解讀階段同時也會造成困擾。 其中,不足的取樣頻率是一個關鍵問題。尼奎斯特(Nyquist)定律是數據訊號處理領域中的一個重要概念:在對連續訊號進行取樣時,取樣頻率應該至少是訊號最高頻率的兩倍,以確保能夠準確地重建原始信號。 若取樣頻率低於訊號最高頻率的兩倍,將會產生混疊效應,導致高頻部分被折疊到低頻區域,進而導致訊號的變形。此外,高頻成分被折疊後,能量分布將會偏移,訊號的能量特性分佈也將受到影響。這種能量偏移可能導致諧波失真,影響頻譜分析的準確性。同時,超過Nyquist頻率的訊號成分也會在取樣過程中沒有辦法被完整辨識,導致部分資料消失。 為了克服這樣的問題,以下方案被提出並廣泛應用。 首先,確保取樣頻率至少是訊號最高頻率的兩倍,以避免混疊效應。此外,在進入類比數位轉換器前,使用低通濾波器處理大於Nyquist頻率的訊號成分,有助於減少能量偏移和頻譜失真的問題。而在訊號擷取後,運用數位濾波演算法進一步去除混疊的訊號,以還原原始訊號特性。 然而,實際應用這些解決方案可能不如理論那麼簡單。確保取樣頻率要高於訊號頻率兩倍的這個要求,需要使用非常之昂貴的高頻儀器來完成。 其中包含示波器、頻譜分析儀、信號產生器、時域反射儀等。同樣地,設計有效的濾波器和運用數位濾波演算法也需要豐富的專業知識和經驗,往往是一項耗時的挑戰。   百佳泰作為高頻訊號完整性方面的專業支援者,透過多年的深耕,我們不僅具備各種高頻精密儀器、設備,也提供多種高頻訊號完整性測試方案,幫助客戶確保訊號的品質。此外,我們為不同介面和規範設計了一系列的高頻量測專用治具,以實現更有系統和效率的量測。其專業技術團隊也將提供濾波器設計的諮詢,並根據客戶需求提供多元的訊號量測方案,進一步協助專案的開發或是產品的驗證。確認訊號完整的同時,也預先排除可能的潛在風險。 我們卓越的專業知識和技術支援,是客戶在產品開發過程及驗證階段的強力後盾,確保時效Faster、設計Easier、品質Better,讓您在市場上更具競爭力並掌握先機。   若您對於高頻訊號完整性及高頻量測專用治具相關的顧問服務有進一步需求,歡迎填寫表單聯繫我們,百佳泰服務團隊將誠摯為您服務! [...]

魔鬼藏在細節裡!使用者情境模擬幫你找出伺服器品質潛在風險!

伺服器多元化應用服務時代正式來臨! 隨著數位化和數據需求不斷增長,伺服器產業也持續成長中,同時各種應用服務也不斷推出,包括雲運算、人工智慧、大數據分析、物聯網、區塊鏈和其他新興技術。在越來越多應用服務推出同時,伺服器的規格也不斷在演進以因應不同的應用服務,例如純運算的AI伺服器、儲存資料的儲存伺服器、運算及儲存兼顧的混合型伺服器,以及適合邊緣運算的邊緣伺服器等。 預先防範潛在風險,降低商譽營收損失 一般來說,應用服務供應商會選擇適合的伺服器規格,來佈署所提供的應用服務,但卻無法確定佈署後的運行效能或穩定度,是否能按照最初規劃的方式呈現。同時,在運行的過程中是否會因為外在的環境因素如溫度、震動等,導致可靠度的問題發生,這些都是無法預測的。而當真的發生運行效能不佳、應用服務平台不穩定或產生可靠度問題,導致伺服器硬體故障等潛在風險產生,都會使應用服務供應商遭受立即性的商譽及營收損失。 另一種情況是當佈署運行一段時間後發現問題,經檢查分析後確認是硬體相關的問題,此時要回頭找系統供應商時卻發現該專案已經結束,相關資源已經解散到其它新專案上。因此系統供應商需要花更多的時間來尋找資源解決問題,再加上硬體可能招回的rework,這些都會是應用服務供應商或採購方的巨大成本。 使用者情境完全模擬,全面防堵各式潛在風險 百佳泰提供使用者情境模擬解決方案能夠在伺服器出貨前先模擬並驗證之後的佈署是否會產生上述的潛在風險,能夠有效的降低佈署後實際發生問題的機率。下面提供幾種使用者情境模擬的例子,來確認伺服器的效能及穩定度: MySQL Database workload simulation MS SQL OLTP workload [...]

儲存伺服器效能降低的關鍵原因:風扇問題深度解析!
儲存伺服器效能降低的關鍵原因:風扇問題深度解析!

雲端服務盛行,儲存需求無止盡 雲端服務供應商堪稱是近十年來全球最炙手可熱的新興服務型態之一,不論是雲端儲存服務、影音串流媒體或牙是社群服務平台等,在面對每天巨量成長的資料,為了持續滿足消費者的龐大需求,儲存容量的擴充自然是時時刻刻都必須面對的課題,也因此數據中心中的儲存伺服器效能便佔有很大的比重。 依據資料本身的屬性,資料的儲存大致可分成熱資料與冷資料而存放在不同的儲存媒體。一般來說,熱資料會偏向儲存在固態硬碟(SSD),而冷資料則存在硬碟(HDD)。又也因為熱資料過一段時間後就會變成冷資料,因此存放冷資料的儲存伺服器會一直不斷地成長。   長時間的振動負載將影響儲存伺服器效能 由於硬碟使用磁盤轉動並以磁碟讀寫頭讀寫資料的特性,採用硬碟的儲存伺服器對於振動會相對地敏感。一旦環境的振動過大,就會影響到資料存取的效能,嚴重者甚至還可能會讓硬碟磁頭/碟片損壞,進而導致該硬碟損毀。一般來說,引起長時間振動負載的主要有以下三個潛在因子: .冷卻用風扇產生的噪音負載.冷卻用風扇本身振動的負載.硬碟本身振動的負載 對此,百佳泰也進行了兩個實驗,一個是噪音對硬碟吞吐量的影響,另一個則是模擬儲存伺服器使用情境時的硬碟效能量測,兩者都顯示風扇的確會影響硬碟的效能。   伺服器關鍵元件/裝置品質測試服務 伺服器上的任何一個元件/裝置,都必須嚴格品質控管,唯有經過縝密測試,才能因應伺服器的高規格及高效能需求。百佳泰深耕IT領域,至今已累積超過30年的測試驗證經驗,針對風扇及振動等相關問題,百佳泰能提供全方位的客製化解決方案。   風扇單體 可靠度測試:以長時間的溫濕度變化循環,搭配風扇轉速及電源循環等情境模擬來驗證風扇的可靠度。在驗證過程中也會定期取出風扇來進行拆解的動作,確認每個部件的磨損狀況。 噪音量測:以聆聽室或無響室來量測風扇在不同轉速時的噪音,提供伺服器製造商於設計伺服器內部構造時的參考。 [...]