-
作者
-
發佈日期
2024-10-31
-
閱讀時間
6分鐘
-
字體大小
隨著雲端科技不斷演變,AWS 正持續突破這項技術的無限可能。專為機器學習而設的 Amazon EC2 Capacity Blocks 是 AWS 推出的最新產品,結合 EC2 UltraClusters 屬性與 P5e 實例高達 3,200 Gbps 的網絡速度及性能,將為正在應對日益增長的人工智慧(AI)和機器學習(ML)需求的企業帶來革命性的轉變。
EC2 Capacity Blocks 的核心來自 UltraClusters 屬性,一項專門為滿足高性能計算及大型機器學習任務而設的功能。UltraClusters 是由數千個加速 EC2 實例組成的叢集,更是一個高度整合的電腦計算網絡,利用第二代彈性網絡適配器(Elastic Fabric Adapter, EFA)技術,這些實例叢集能夠達成千兆位級別的網絡功能,確保數據能夠在如同「腦震盪」小組討論中自由快速流動。
然而,EC2 Capacity Blocks 真正的精妙之處,在於其整合了 P5e 實例類型。這些由 NVIDIA 最新推出的 H100 GPUs 驅動的實例,不止能夠應付最原始的電腦計算效能,更能夠以驚人的速度轉移數據。在 UltraClusters 中,P5e 實例的網絡吞吐量高達 3,200 Gbps,其令人膛目結舌的速度不僅帶來漸進式改進,而是能夠讓研究及開發人員以量子跳躍級別的效率開闢新領域,重新定義由雲端技術 AI 及 ML 工作需求所帶來的無限可能性。
試想像一下,當訓練大型語言模型時,參數更新能夠在數百個 GPU 之間無縫流動,或是在巨量的數據集上以幾乎沒有延遲的速度進行即時推理,這就是 UltraClusters 中的 P5e 實例所展現的效能。經過提升的 NVIDIA NVLink 連接能夠確保 GPU 之間的通信如絲綢般順滑,進一步提升分散式訓練任務的整體性能。
然而,AWS 並非只聚焦於原始性能,而是致力在現今快速變化的科技環境中,突顯靈活度及成本效益的重要性。這就是 EC2 Capacity Blocks 容許使用者於 1 至 28 天內,在世界任何角落短暫預留這些強大的資源的原因。透過這樣的方式,AWS 在為關鍵項目分配專用資源,以及避免高性能運算設置常見的長期應用之間取得了完美平衡。
這項新技術所帶來的影響無遠弗屆。從加速氣候模型、藥物研發等領域中建立科研模擬系統,到在自然語言處理或電腦視覺的領域上構建更複雜的 AI 模型上,其可能性將達致無限大。初創企業因此能夠以低廉的價格應用超級電腦水平的資源,而具規模的企業則能夠以前所未見的靈活性擴展其 AI 計劃。
自推出以來,業界對於 Amazon EC2 Capacity Blocks 的反應都十分正面。Amplify Partners 認為這對初創企業具有變革性,而 Canva 則計劃利用它來訓練更大模型。Leonardo.Ai 對於彈性網絡適配器感到興奮,OctoML 則重視能夠精確匹配客戶需求的資源能力。這些來自客戶的反饋突顯了該服務的多功能性,從賦能初創企業到增強現有平台的能力,在各個領域中加速 AI 創新的潛力。
AWS 正計劃開展更驚人、更令人興奮的研究項目。EC2 Capacity Blocks 現時以美國的俄亥俄州、北維珍尼亞州、俄勒岡州及澳洲的墨爾本作為首批開放應用的地區,未來更計劃擴展到其他 AWS 地區及當地區域。這些項目將拓展 AI 及 ML 資源至全球各地,為各行各業加快創新進程。
Amazon EC2 Capacity Blocks 結合其 UltraClusters 屬性及 P5e 實例的驚人網絡速度,正為雲端 AI 及 ML 需求帶來重大飛躍,其兼備靈活性及成本效益原始性能的特點,不僅解決當前的電腦計算挑戰,更為下一代 AI 發展突破鋪平道路。隨著研究與開發人員掌握這些資源,我們將可展望未來有更多顛覆性應用及發現。
相關文章:
AWS 與 NVIDIA 兩強聯手 共同邁向 AI 研發競賽之路
UD 與 AWS 合作保障數碼金融安全 重新定義雲端安全
AWS 推出基於機器學習的 EC2 企業可按 AI 訓練需求彈性租用 GPU