Category Archives: Server – 潛在風險剖析

你的系統持續在發熱,別被散熱風扇騙了!

隨著科技的成長,需要被存儲、計算、傳送等的資料會愈來愈多,因此,設置高密度的Data center / Server對於商業基礎設施和國家基礎建設來說也變得格外重要。在物聯網、雲端存儲、大數據運用、人工智能和5G等領域的加速發展下,數據中心的建置與需求也將越來越龐大,而數據中心在全年無休運行下會產生高密度的廢熱,這些廢熱主要是由每一櫃中數個伺服器所產生,若未能有效地進行散熱,將容易導致系統過熱無法正常運行,因此對數據中心的伺服器性能的穩定性來說,運用風扇或水冷來達到散熱這課題也相對重要。 伺服器風扇過熱會有哪些潛在風險? 在高溫環境中長時間運作,伺服器風扇所使用的塑料材質,可能會因熱變質而變脆,進而造成破損,導致風扇有可能在持續運轉,但效能已經降低。風扇效能降低,會影響伺服器的散熱效率,使伺服器內部元件過熱,造成元件損壞。元件損壞後,可能會導致伺服器無法正常運作,甚至造成資料遺失或系統崩潰。這個結果將導致應用服務停擺,甚至是客戶資料的流失,進而引起消費者客訴等負面的使用者體驗。 實際案例分享 根據百佳泰多年實驗經驗,我們針對實際案例進行說明:客戶的產品在進行長時間的可靠度驗證時,我們發現在長時間運轉下,雖然風扇依舊持續旋轉,但其塑料材質已開始脆化進而出現裂紋。因此即使風扇雖仍舊在運轉,但我們已經將這類的現象判為問題件了。 百佳泰提供三大解決方案 百佳泰針對伺服器風扇的可靠度驗證有非常多豐富的專案經驗,同時也設計了一套解決方案來提供服務。百佳泰自行設計、開發了一套風扇專用的測試治具,此治具以模組化組成,最多可以支援15顆風扇同時測試。 另外,百佳泰也自行開發測試自動化軟體,能將治具支援的15顆風扇虛擬成三組,分別進行不同的測試項目,如:Full power mode 或是Power cycle [...]

伺服器散熱效能不佳有解嗎?專家建議這麼做
伺服器散熱效能不佳有解嗎?專家建議這麼做

今年AI技術的話題不斷,隨著相關應用服務的陸續推出,AI的趨勢已經是一個明確的趨勢及方向,這也連帶使得AI伺服器的出貨量開始加速成長。AI伺服器因為有著極高的運算效能,伴隨而來的即是大量的熱能產生,因此散熱效能便成為一個格外重要的議題。其實不只AI伺服器有著散熱的問題,隨著Intel及AMD 的CPU規格也不斷地在提升,非AI應用的伺服器的散熱問題也是不容小覷的潛在問題。即便如此,由於目前的液冷技術仍有許多待克服的地方,舉凡像是建置成本昂貴,機殼、軌道、水路、資料中心等項目都得重新設計來過,維修人員也得需要時間重新訓練。因此目前市面上出貨的伺服器大多數還是以氣冷式為主。   一站式客製化顧問諮詢,有效改善伺服器散熱效能 氣冷式的散熱架構及散熱料件將決定伺服器的散熱效能。當散熱效能不夠好時,伺服器的溫度將會持續升高,若此時機房的冷氣無法有效地降低溫度時,將會導致伺服器因溫度過高而啟動保護措施,包括降速或強制關機。當保護措施啟動時,對外的影響就是應用服務效能降低,使用者感覺回應變慢,甚至是因強制關機而導致的服務中斷等等,這些都會造成使用者的負面體驗。 在伺服器散熱效能的評估上,百佳泰除了具備豐富的實務經驗及專業的技術團隊,可協助進行不同散熱架構的建置及數據收集,提供客戶不同散熱料件的全面性分析與評估。依據伺服器產品需求的不同,百佳泰能提供一站式的客製化顧問服務、,涵蓋了如機構、電性、並搭配高頻領域的環測項目。除此之外,在服務過程中對於產品的各種系統介面、指令操作、軟體更新、硬體更換等測試細節,百佳泰不僅擁有相關的技術能力與執行經驗,更可提供相關的測試建議與諮詢,進而滿足客戶的各項需求。   舉一個專案的例子來說,百佳泰協助該客戶更換不同的散熱料件,並將收集到的數據整理後提供給客戶,客戶即可透過百佳泰所提供的測試數據,選擇出最佳搭配的散熱模組。收集不同散熱材料的數據,CPU最高的溫差可達5度,客戶由此可得知不同料件,對散熱效能影響的差異。   或者像下圖這個專案,經過散熱架構的選定、微調以及散熱材料的選擇後,百佳泰成功將將整體伺服器的溫度下降約9.3°C,達到客戶要求的標準。   Faster, Easier, Better!值得您信賴的檢測技術顧問 百佳泰深耕IT領域,至今已累積超過30年的測試驗證經驗,透過全面性的智慧檢測建議與分析,百佳泰能替伺服器相關產品客戶帶來全方位的客製化解決方案,致力打造更快速、更高效,同時更加完善的一站式顧問諮詢服務,與客戶一同為產品品質進行嚴格把關。 [...]

魔鬼藏在細節裡!使用者情境模擬幫你找出伺服器品質潛在風險!

伺服器多元化應用服務時代正式來臨! 隨著數位化和數據需求不斷增長,伺服器產業也持續成長中,同時各種應用服務也不斷推出,包括雲運算、人工智慧、大數據分析、物聯網、區塊鏈和其他新興技術。在越來越多應用服務推出同時,伺服器的規格也不斷在演進以因應不同的應用服務,例如純運算的AI伺服器、儲存資料的儲存伺服器、運算及儲存兼顧的混合型伺服器,以及適合邊緣運算的邊緣伺服器等。 預先防範潛在風險,降低商譽營收損失 一般來說,應用服務供應商會選擇適合的伺服器規格,來佈署所提供的應用服務,但卻無法確定佈署後的運行效能或穩定度,是否能按照最初規劃的方式呈現。同時,在運行的過程中是否會因為外在的環境因素如溫度、震動等,導致可靠度的問題發生,這些都是無法預測的。而當真的發生運行效能不佳、應用服務平台不穩定或產生可靠度問題,導致伺服器硬體故障等潛在風險產生,都會使應用服務供應商遭受立即性的商譽及營收損失。 另一種情況是當佈署運行一段時間後發現問題,經檢查分析後確認是硬體相關的問題,此時要回頭找系統供應商時卻發現該專案已經結束,相關資源已經解散到其它新專案上。因此系統供應商需要花更多的時間來尋找資源解決問題,再加上硬體可能招回的rework,這些都會是應用服務供應商或採購方的巨大成本。 使用者情境完全模擬,全面防堵各式潛在風險 百佳泰提供使用者情境模擬解決方案能夠在伺服器出貨前先模擬並驗證之後的佈署是否會產生上述的潛在風險,能夠有效的降低佈署後實際發生問題的機率。下面提供幾種使用者情境模擬的例子,來確認伺服器的效能及穩定度: MySQL Database workload simulation MS SQL OLTP workload [...]

儲存伺服器效能降低的關鍵原因:風扇問題深度解析!
儲存伺服器效能降低的關鍵原因:風扇問題深度解析!

雲端服務盛行,儲存需求無止盡 雲端服務供應商堪稱是近十年來全球最炙手可熱的新興服務型態之一,不論是雲端儲存服務、影音串流媒體或牙是社群服務平台等,在面對每天巨量成長的資料,為了持續滿足消費者的龐大需求,儲存容量的擴充自然是時時刻刻都必須面對的課題,也因此數據中心中的儲存伺服器效能便佔有很大的比重。 依據資料本身的屬性,資料的儲存大致可分成熱資料與冷資料而存放在不同的儲存媒體。一般來說,熱資料會偏向儲存在固態硬碟(SSD),而冷資料則存在硬碟(HDD)。又也因為熱資料過一段時間後就會變成冷資料,因此存放冷資料的儲存伺服器會一直不斷地成長。   長時間的振動負載將影響儲存伺服器效能 由於硬碟使用磁盤轉動並以磁碟讀寫頭讀寫資料的特性,採用硬碟的儲存伺服器對於振動會相對地敏感。一旦環境的振動過大,就會影響到資料存取的效能,嚴重者甚至還可能會讓硬碟磁頭/碟片損壞,進而導致該硬碟損毀。一般來說,引起長時間振動負載的主要有以下三個潛在因子: .冷卻用風扇產生的噪音負載.冷卻用風扇本身振動的負載.硬碟本身振動的負載 對此,百佳泰也進行了兩個實驗,一個是噪音對硬碟吞吐量的影響,另一個則是模擬儲存伺服器使用情境時的硬碟效能量測,兩者都顯示風扇的確會影響硬碟的效能。   伺服器關鍵元件/裝置品質測試服務 伺服器上的任何一個元件/裝置,都必須嚴格品質控管,唯有經過縝密測試,才能因應伺服器的高規格及高效能需求。百佳泰深耕IT領域,至今已累積超過30年的測試驗證經驗,針對風扇及振動等相關問題,百佳泰能提供全方位的客製化解決方案。   風扇單體 可靠度測試:以長時間的溫濕度變化循環,搭配風扇轉速及電源循環等情境模擬來驗證風扇的可靠度。在驗證過程中也會定期取出風扇來進行拆解的動作,確認每個部件的磨損狀況。 噪音量測:以聆聽室或無響室來量測風扇在不同轉速時的噪音,提供伺服器製造商於設計伺服器內部構造時的參考。 [...]

邊緣伺服器應用在戶外的設計挑戰與潛在風險

近年來,邊緣伺服器技術在各領域迅速發展,廣泛應用於戶外環境中,如:智慧城市、智慧交通裡常見的邊緣AI及邊緣運算伺服器等。這些邊緣伺服器因佈署在戶外,為了做到防水及防塵的目的,大多會採用無風扇的設計,同時也因考量佈署位置的問題,通常會設計較小的尺寸。然而體積小、無風扇的設計所帶來的就是散熱和耐用性問題。 溫度的變化是戶外環境最大的挑戰! 舉例來說,在熱帶地區夏季的溫度再加上太陽的曝曬,可能使邊緣伺服器達到超過60°C的高溫;在寒帶地區冬季夜晚的低溫可能達到-40°C以下;日夜溫差大的地區或季節其溫度變化可能超過40°C。以下都是邊緣伺服器應用在戶外的潛在風險: 1. 白天的高溫可能導致邊緣伺服器因採用無風扇設計而無法有效及時散熱,進而導致強行關機 2. 夜晚的低溫可能導致電子元件無法運作而使邊緣伺服器無法啟動 3. 長時間的日夜溫差變化而導致邊緣伺服器的使用壽命縮短 當上述的潛在風險導致邊緣伺服器故障時,智慧城市或智慧交通將不在智慧,且有可能引起各種混亂或交通意外。 對於以上三項潛在風險,百佳泰能夠提供一系列的顧問服務進行評估: 1. 評估工作模式下的最高溫、最低溫的最大極限值 2. 評估被破壞無法恢復的最高溫、最低溫的極限值 [...]

伺服器應用在運輸工具可能引發災難性風險

高效能伺服器運算的重要性 資訊科技加持的數位時代,許多人紛紛追求運算效能更高、更穩定。隨著這些需求持續增加與技術上不斷進步,伺服器的運算效能加速提升;而體積不斷的縮小,因此伺服器的應用也從集中式的資料中心擴展到邊緣運算,甚至終端產品。而移動式的運輸工具也是伺服器的重要應用之一,不論是航空、海運或陸運,又或者民生、軍事、科學等特殊用途,皆可能仰賴伺服器來處理運輸工具在移動時的各種狀況。以車載伺服器舉例,它會提供路況偵測並及時處理及通知任何異常狀況,甚至輔助駕駛做障礙物閃避或緊急煞的動作,這些及時的處理都是需要藉由高效能的伺服器運算來完成。 面對3大威脅,如何評估進而執行防護措施? 當運輸工具上的伺服器發生故障時,它會造成極嚴重的影響,甚至會威脅到個人或眾人的生命安全。 造成運輸工具上伺服器發生故障的主要最大潛在風險是『長時間的高/低溫、劇烈的溫度變化』及『行進過程中所產生的震動』。 1. 長時間高溫或低溫可能導致伺服器強行關機 2. 而劇烈的溫度變化可能導致電子元件的快速熱漲冷縮而故障 3. 持續的震動可能會導致零件的鬆動而脫落,進而造成伺服器故障 以航空器為例,在起飛及降落時會產生劇大的溫度變化,在固定航高時則處在極低溫環境,整個航行過程中都會有震動的產生。 然而,汽車也會有類似的情境,它可能會在極地氣候如冰雪或沙漠中行駛,而它的震動也是在行駛中會持續的產生,並根據路況可能會有劇烈的起伏。 對於上述的三個潛在風險,百佳泰能夠提供一系列全方位的顧問服務來評估: 1. [...]