12月23日,由中國(guó)信息通信研究院主辦的智算IP廣域網(wǎng)產(chǎn)業(yè)交流會(huì)在北京成功舉辦。本次交流會(huì)以“打造超彈性無(wú)損智算IP廣域網(wǎng),加速邁向智能時(shí)代”為主題,企業(yè)、科研機(jī)構(gòu)積極響應(yīng)。其中,中國(guó)移動(dòng)通信集團(tuán)重慶有限公司計(jì)劃部劉輕舟副總經(jīng)理基于重慶移動(dòng)打造的“存算拉遠(yuǎn)”智算創(chuàng)新項(xiàng)目做了成果分享。
劉輕舟介紹,隨著新能源智能車(chē)企的快速發(fā)展,海量樣本數(shù)據(jù)大模型訓(xùn)練成為車(chē)企發(fā)展的必需業(yè)務(wù)場(chǎng)景,也是智能車(chē)企發(fā)展的關(guān)鍵。重慶移動(dòng)聚焦車(chē)企普遍關(guān)注的先傳后訓(xùn)方式導(dǎo)致算力資源利用率低、敏感數(shù)據(jù)出園區(qū)導(dǎo)致安全擔(dān)憂等痛點(diǎn),攜手華為推出了智算互聯(lián)網(wǎng)絡(luò)解決方案。該方案基于新一代路由器,創(chuàng)新性采用彈性存算拉遠(yuǎn)架構(gòu),并結(jié)合廣域RDMA無(wú)損網(wǎng)絡(luò)技術(shù),兼顧了數(shù)據(jù)安全、海量數(shù)據(jù)傳輸效率及算效提升的訴求。
劉輕舟指出,考慮到業(yè)務(wù)發(fā)展初期,運(yùn)營(yíng)商的網(wǎng)絡(luò)建設(shè)成本及客戶大模型計(jì)算成本,重慶移動(dòng)首創(chuàng)提出了廣域RDMA+G-SRv6的無(wú)損網(wǎng)絡(luò)融合方案,采用RDMA、深度負(fù)載分擔(dān)、智能流調(diào)度和逐流反壓等關(guān)鍵技術(shù),同時(shí)利用客戶側(cè)已有的標(biāo)準(zhǔn)存儲(chǔ),確?蛻魯(shù)據(jù)在智算中心不落盤(pán),通過(guò)新一代智算設(shè)備互聯(lián)實(shí)現(xiàn)網(wǎng)存協(xié)同。該方案面向客戶提供確定性、彈性、可信智算互聯(lián)專(zhuān)線及智算算力租賃服務(wù)。
存算拉遠(yuǎn)架構(gòu)創(chuàng)新:存算拉遠(yuǎn)架構(gòu)將原始數(shù)據(jù)留存在客戶本地,避免傳輸過(guò)程數(shù)據(jù)泄露對(duì)企業(yè)造成的損失。在智算中心計(jì)算時(shí),采用邊傳邊訓(xùn)的方式,極大降低了算卡空閑率,縮短訓(xùn)練整體總耗時(shí)時(shí)間,有利于智算算力服務(wù)的普及和推廣。
智能調(diào)度技術(shù)創(chuàng)新:智算互聯(lián)網(wǎng)絡(luò)解決方案通過(guò)帶寬有效利用率提升及時(shí)延、丟包的優(yōu)化來(lái)確保高吞吐率,降低計(jì)算服務(wù)器的等待時(shí)間,提升智算中心的整體算效。同時(shí),還基于多種IPv6+技術(shù),實(shí)現(xiàn)不同網(wǎng)絡(luò)路徑的負(fù)載均衡精度控制在5%以?xún)?nèi),帶寬利用率提升到90%以上,顯著提高了網(wǎng)絡(luò)傳輸效果。
通過(guò)一系列的技術(shù)創(chuàng)新,重慶移動(dòng)存算拉遠(yuǎn)項(xiàng)目在超長(zhǎng)距離網(wǎng)絡(luò)中,訓(xùn)練效率提升近1倍,月度迭代訓(xùn)練任務(wù)數(shù)提升近70%。極大解決了算力空閑等待時(shí)間長(zhǎng)的問(wèn)題,大幅降低企業(yè)使用大模型訓(xùn)練的成本,為高效算力服務(wù)的推廣,加速普惠算力服務(wù)千行百業(yè)貢獻(xiàn)了重要力量。
展望未來(lái),重慶移動(dòng)將持續(xù)攜手產(chǎn)業(yè)伙伴,打通計(jì)算、網(wǎng)絡(luò)、安全等產(chǎn)業(yè),基于算存模式,推動(dòng)關(guān)鍵技術(shù)的深度融合與創(chuàng)新,不斷打造更高質(zhì)量的智算專(zhuān)線,實(shí)現(xiàn)跨通信、計(jì)算為一體的協(xié)同運(yùn)作,提高整體產(chǎn)業(yè)的競(jìng)爭(zhēng)力。