根據TrendForce(集邦)最新AI產業研究指出,北美五大雲端服務供應商(CSP)為擴大AI訓練和推論應用部署,今年對整櫃式AI伺服器的採購意願明顯提高,不僅有望佔據全球60%以上的輝達GB/VR需求量,更將同步帶動五大業者總AI訓練算力年增逾56%、總AI推論算力年成長高達122%左右。
集邦預估,今年AI伺服器出貨將年增28%以上,仍以高階AI訓練機種為主力,佔比約55%。然中長期內將改由AI推論機種主導,主因是CSP將積極推展AI應用以加速實現AI雲端服務商用化,另像是輝達也將拓展更多AI推論方案或使用情境,包括推動今年主力AI伺服器方案GB/VR系統除AI訓練用途外,也特別強調該方案可支援AI推論相關工作負載。
5巨頭今年資本支出超過7700億美元 總算力今年估將成長1.2倍
集邦估計,今年Google、Amazon、Microsoft、Meta、Oracle的合計資本支出將逾7700億美元,年增近87%。分析北美五大CSP購置輝達GB/VR系列獲得的運算能力,針對AI訓練部分,若以FP16、BF16為估算基礎,2025年五大業者的總算力達逾9 ExaFLOPS,今年另將成長56%以上。
針對AI推論,若以FP4、NVFP4運算效能為估算基礎,2025年五大CSP的總算力逾37 ExaFLOPS,預計今年將大幅成長近122%,顯著高於AI訓練,反映出輝達此次軟硬體系統調校特別著重AI推論效能,並落實在新一代的GB300、VR200整櫃式方案中。
除GPU方案外,CSP業者同步推進自研ASIC整櫃產品,以Google布局最積極。集邦預估,今年Google對自家TPU晶片需求量將年增近80%,並於下半年後將從v7逐漸升級至v8世代。Amazon自研ASIC的力道僅次於Google,預計今年其Trainium系列於自家AI伺服器佔比將達40%以上。
而集邦估算,2023年北美五大CSP的伺服器功耗合計年增2.8GW,到今年躍升至18GW,去年至今年的年成長率高達116%,主因即AI競賽白熱化,輝達GB300、AMD Helios和CSP自研ASIC平台將同步放量。