亚洲色大成网站www-少妇性bbb搡bbb爽爽爽欧美-久久久久爽爽爽爽一区老女人-人妻丰满熟妇av无码区-欧性猛交ⅹxxx乱大交

歡迎訪問深圳市中小企業(yè)公共服務平臺電子信息窗口

WAIC上的RDMA智能網(wǎng)卡,已成為國產(chǎn)AI算力突破的重要一環(huán)!

2025-08-14 來源:電子工程專輯 原創(chuàng)文章
174

關鍵詞: AI基礎設施 RDMA智能網(wǎng)卡 云脈芯聯(lián) RoCE技術 算力突破

生成式AI、Agentic AI的大熱,帶動的不單是GPU、AI芯片的發(fā)展,當我們談到AI數(shù)據(jù)中心就必談到“萬卡”集群時,“互連”和“數(shù)據(jù)通信”的重要性也快速凸顯。單張顯卡或者AI加速卡已難以支持當下巨量參數(shù)規(guī)模的AI大模型訓練和推理,跨芯片、跨板卡、跨節(jié)點組建AI基礎設施成為算力增長的主要方向,RDMA智能網(wǎng)卡作為網(wǎng)絡互聯(lián)的核心組件,成為算力突破的重要一環(huán)。

過去一年的媒體活動上,不少企業(yè)都談到大模型訓練時,GPU真正工作的時間有時只占1/3,大部分的時間都耗費在了數(shù)據(jù)傳輸?shù)牡却稀K郧安痪?a style="box-sizing: border-box; margin: 0px; padding: 0px; background-color: transparent; color: rgb(51, 122, 183); text-decoration-line: none; outline: none; -webkit-tap-highlight-color: rgba(255, 0, 0, 0);">摩爾線程在WAIC(世界人工智能大會)媒體活動上提出,AI工廠效率 = 加速計算通用性 × 單芯片有效算力 × 單節(jié)點效率 × 集群效率 × 集群穩(wěn)定性。

這里的“集群效率”顯然是指更低的GPU閑置率,尤其是數(shù)據(jù)傳輸?shù)男省9识泼}芯聯(lián)創(chuàng)始人兼CEO劉永鋒在WAIC上提出,整體算力 = 算力密度(GPU)× 算力規(guī)模(交換芯片) × 數(shù)據(jù)傳輸效率(網(wǎng)卡芯片)——這是個相對而言更具體的描述方式。

劉永鋒表示,“上下游眾志成城、取長補短”,“通過融合創(chuàng)新”“把國產(chǎn)化做起來”,實現(xiàn)“算力突破”。這也是國內(nèi)所有涉足AI基礎設施搭建的企業(yè)的共識。

PARTNER CONTENT


我們在WAIC之上就看到了云脈芯聯(lián)的“AI時代智能算力互聯(lián)網(wǎng)絡解決方案”,包括智能網(wǎng)卡(SmartNIC)和DPU產(chǎn)品。云脈芯聯(lián)很大程度上是可以代表國產(chǎn)NIC、DPU芯片及解決方案的最高水平的——其YSA-100芯片產(chǎn)品及系列智能網(wǎng)卡/DPU產(chǎn)品就已經(jīng)在頭部互聯(lián)網(wǎng)、基礎設施服務商、運營商等各行業(yè)實現(xiàn)量產(chǎn)出貨,客戶包括浪潮、新華三、上海儀電、浙江銀盾云、中國移動等,據(jù)說客戶覆蓋還在穩(wěn)步增長。

本文就以圖集的形式來看看云脈芯聯(lián)的現(xiàn)有產(chǎn)品,及其所反映的國產(chǎn)智能網(wǎng)卡與DPU發(fā)展現(xiàn)狀。

▲ 云脈芯聯(lián)YSA-100網(wǎng)絡芯片,“支持高性能網(wǎng)絡和DPU場景的裸金屬、虛擬化卸載(offload)加速,適用于算力基礎設施智算中心網(wǎng)絡、存儲和云計算等各類應用場景”。YSA-100是一顆ASIC架構的網(wǎng)絡芯片,云脈芯聯(lián)在去年的新聞稿中說,這顆芯片已經(jīng)于2024年量產(chǎn),是“國內(nèi)首顆支持400Gbps吞吐能力的RDMA(直接內(nèi)存訪問)高性能網(wǎng)絡芯片”;且這顆芯片已經(jīng)在多個智算中心落地應用。

▲ metaConnect-400S,metaConnect系列在云脈芯聯(lián)的產(chǎn)品定位為“AI NIC”。 metaConnect-400S的具體定位是“高性能AI網(wǎng)卡”,尤其表現(xiàn)在單口400GbE吞吐速率,“提供具有包噴灑多路徑能力的高性能RDMA網(wǎng)絡能力”,且“與各CPU和GPU產(chǎn)品均有優(yōu)秀的兼容能力”。

面向智算中心時,“metaConnect-400S提供1x400GbE網(wǎng)絡接入能力,支持多路徑負載均衡和亂序重排能力,基于Credit授權的擁塞控制和可編程擁塞控制算法能力,有效提升AI計算通信效率,對比業(yè)內(nèi)主流產(chǎn)品通信性能提升約5%。”這款產(chǎn)品在我們看來也是真正能夠體現(xiàn)以太網(wǎng)用于AI大規(guī)模集群networking的潛力和價值的。

▲ metaConnect-400,相較前者的主要差異是,這是個支持2x200GbE的AI NIC,“增值能力實現(xiàn)單QP(queue pair)雙平面網(wǎng)絡400Gbps吞吐性能”——使用一個QP同時在兩個物理網(wǎng)絡平面上達成400Gbps總吞吐量。

▲ metaScale-200S智能網(wǎng)卡——相較前面的metaConnect系列,云脈芯聯(lián)定義metaScale系列產(chǎn)品為“高性能智能網(wǎng)卡”。200S是實現(xiàn)了單口200GbE的、面向云計算數(shù)據(jù)中心高性能存儲網(wǎng)絡和智算中心AI計算網(wǎng)絡打造的智能網(wǎng)卡產(chǎn)品,同樣提供高性能RoCEv2網(wǎng)絡能力。

▲ 同為metaScale-200S智能網(wǎng)卡,OCP 3.0接口版。

▲ metaScale-200,2x100GbE吞吐能力,PCIe標準形態(tài);

▲ 同為metaScale-200,OCP 3.0標準接口版;

▲ metaScale-50,25GbE智能網(wǎng)卡,“面向現(xiàn)代數(shù)據(jù)中心,具備高性能存儲網(wǎng)絡互聯(lián)能力”,“提供優(yōu)異的網(wǎng)絡互聯(lián)收發(fā)性能,成熟的平臺兼容性,豐富的軟件生態(tài),以及靈活的解決方案能力”。

▲ 基于YSA-100芯片的metaVisor-200,云脈芯聯(lián)稱其為AI DPU。介紹中提到,這款metaVisor-200是面向人工智能智算中心AI計算網(wǎng)絡打造的2x100GbE高性能AI DPU產(chǎn)品。

“支持云盤啟動、VPC網(wǎng)絡卸載加速、RoCEv2 Overlay和RDMA統(tǒng)一納管運維監(jiān)控的能力,為未來智算中心提供快速發(fā)放、租戶網(wǎng)絡隔離和彈性部署等靈活解決方案”。

▲ 云脈芯聯(lián)展位擺了一臺來自新華三的服務器,算力卡則是來自國產(chǎn)GPU;中間的四張網(wǎng)卡就來自云脈芯聯(lián)——這是云脈芯聯(lián)的智能網(wǎng)卡/DPU在AI算力領域落地的形式之一。

劉永鋒在演講中提到國產(chǎn)算力突破的兩個方向,其一是“提前布局、因地制宜”——比如前文提到云脈芯聯(lián)在RoCE上的布局。 “在更大規(guī)模、更高帶寬場景下,以太網(wǎng)是更有潛力的。過去RoCE在AI應用上可能存在一些不成熟的地方——但如果能提前布局投入對RoCE的優(yōu)化,今天會看到以太網(wǎng)真正的價值。現(xiàn)在很多大廠已經(jīng)在投入RoCE。”“它是能夠?qū)崿F(xiàn)AI算力突破很好的技術。”

RoCE (RDMA over Converged Ethernet) 也就是通過以太網(wǎng)做RDMA,在不需要操作系統(tǒng)、CPU介入的情況下,就直接訪問內(nèi)存,得以實現(xiàn)超低延遲、高吞吐,以及降低CPU的開銷。它對諸如HPC、AI訓推、大規(guī)模存儲系統(tǒng)這類數(shù)據(jù)密集型應用價值甚大。

劉永鋒提到,“在芯片研發(fā)方面提前布局RoCE,經(jīng)過持續(xù)的技術創(chuàng)新,在AI網(wǎng)絡需要更大規(guī)模和更高帶寬的情況下,云脈芯聯(lián)200Gbps和400Gbps高性能智能網(wǎng)卡已逐步建立起差異化的競爭優(yōu)勢,具有很強的爆發(fā)力,成為國產(chǎn)網(wǎng)絡在AI基礎設施領域?qū)崿F(xiàn)突破的基礎。”

其二是上下游配合,“眾志成城、取長補短”。比如上述產(chǎn)品的宣傳文案大多都提及 “具備卓越的多平臺兼容性,與各CPU與GPU有優(yōu)秀的兼容能力”,包括對一眾國產(chǎn)CPU、GPU和操作系統(tǒng)的支持。“國產(chǎn)交換芯片和國產(chǎn)網(wǎng)卡芯片能夠深度協(xié)同,就可以形成靈活的最優(yōu)解決方案,其中網(wǎng)絡互聯(lián)芯片成為最核心的一環(huán)。”

WAIC上,云脈芯聯(lián)展位工作人員告訴我們,“云脈芯聯(lián)已與展館中的GPU廠商,和大多數(shù)CPU及相關的應用廠商成為合作伙伴。”“與國內(nèi)部分頭部互聯(lián)網(wǎng)廠商、云基礎設施服務商和通信運營商均有合作——不僅是因為供應鏈安全,國內(nèi)芯片廠商也能夠根據(jù)客戶需求去為他們提供更好的解決方案;當然產(chǎn)品的性能本身需要達到要求。”

劉永鋒則舉例提及在DeepSeek發(fā)布之后,云脈芯聯(lián)與其他合作伙伴多方配合,去適配DeepEP(一個特別面向MoE和EP – expert parallelism的通信庫),實現(xiàn)“端到端拉通”。“上下游一起努力把國產(chǎn)化做起來。”在半導體制造工藝、技術能力受限的情況下,通過與AI基礎設施其他參與者的適配、協(xié)作,才能達成真正意義上的“算力突破”。




主站蜘蛛池模板: 久久一本人碰碰人碰| 亚洲国产一区二区三区| 国产精品成人久久小草| 亚洲日韩精品一区二区三区无码| 欧美丰满熟妇xxxxx| 亚洲日韩乱码一区二区三区四区| 久久精品国产99国产精品| 精品久久综合1区2区3区激情| 国产男女无遮挡猛进猛出| 777人体大胆中国人体哦哦| 国产成人午夜福利免费无码r| 亚洲精品国产第一区第二 | 好了av四色综合无码| 无码午夜成人1000部免费视频| 午夜熟女插插xx免费视频| 麻豆精产国品| 男人一边吃奶一边做爰免费视频| 日本黄页网站免费大全| 久久亚洲熟女cc98cm| 亚洲s码欧洲m码国产av| 国产精品黄在线观看免费软件| 欧美mv日韩mv国产网站| 国产精品丝袜久久久久久不卡| 国产精品无码专区| 亚洲乱色伦图片区小说| 无码孕妇孕交在线观看| 亚洲一区精品二人人爽久久| 性生交大全免费看| 中字幕人妻一区二区三区| 国产高清不卡一区二区| 精品国产香蕉伊思人在线| 久久久www成人免费精品| 两个人看的www在线观看| 亚洲国内精品自在线影院| 囯产精品一品二区三区| 高清欧美性猛交xxxx黑人猛交 | 中文字幕乱码免费视频| 国产98色在线 | 国产| 日本高清成本人视频一区| 一区二区三区四区在线 | 网站 | 苍井空张开腿实干12次|