央視“意外”曝光參數:平頭哥PPU芯片超越英偉達A800
關鍵詞: 華為昇騰 壁仞科技 國產卡與NV卡重要參數對比 阿里平頭哥
在9月16日晚間,央視《新聞聯播》在報道“中國聯通三江源綠電智算中心項目建設成效”時,意外引發科技圈熱議——畫面背景中出現的一張“國產卡與NV卡重要參數對比”表格,首次高調展示了華為昇騰910B、壁仞科技104P等國產AI芯片在關鍵性能指標上對國際巨頭英偉達的追趕與超越。
在李強總理甘肅、青海調研的新聞畫面中,“國產卡與NV卡重要參數對比”表格成為國產算力芯片技術實力的有力證明。其中,阿里平頭哥半導體有限公司推出的PPU(Parallel Processing Unit,并行處理器)芯片,憑借其卓越的性能參數,成為這場技術展示中的焦點。
平頭哥PPU超越英偉達A800
據央視報道及后續多方信息證實,阿里平頭哥的PPU芯片在關鍵技術指標上實現了對英偉達A800的超越。具體來看,平頭哥PPU采用了96GB HBM2e顯存,與英偉達H20的96GB HBM3容量持平(盡管H20采用更新一代的HBM3,技術領先),而英偉達A800的顯存容量為80GB。
在片間帶寬方面,PPU達到700GB/s,遠超A800的400GB/s,接近H20的水平。部分報道甚至指出該數值為“900GB/s”,可能存在不同版本或測量標準差異,但普遍共識是PPU在互聯帶寬上實現了對A800的顯著超越。
此外,PPU還支持更先進的PCIe 5.0接口,優于A800的PCIe 4.0,與H20保持一致。功耗控制在400W,與A800相當,但在能效比上表現出色,明顯低于H20的550W。
簡單來說,顯存容量是算力卡的“數據倉庫”,越大越能同時處理復雜AI任務;片間帶寬是數據傳輸的“高速路”,越寬AI訓練、推理速度越快;PCIe規格決定了算力卡與服務器的連接效率。
據《投資研究》公眾號“壹號講獅”援引云棲大會實測數據,平頭哥PPU在Llama2-70B、GPT-3.5等主流大模型上的表現與英偉達H20互有勝負:
批尺寸為1時,首token延遲為82ms,優于H20的95ms;
批尺寸擴展至64時,PPU吞吐達2800 tokens/s,較H20提升約18%;
整機功耗僅350W,能效比領先30%以上。
更關鍵的是成本優勢:得益于國內7nm工藝與2.5D封裝,PPU單卡BOM成本較進口H20下降40%,推動阿里云公有云推理實例價格下降50%。
三江源智算中心簽約,平頭哥獲最大算力訂單
此次新聞聯播報道的中國聯通三江源綠電智算中心項目,是國產AI芯片規模化落地的重要案例。其于2024年8月17日正式揭牌,總投資約27.7億元,旨在構建集約化、規模化、綠色化的智算綜合園區,支撐“東數西算”戰略需求。2024年3月,項目啟動建設并分階段實施。二期投資8.8億元建設840架高功率服務器機柜,形成超10000P算力能力;三期于同年8月23日開工,規劃984架機柜,算力規模達12000P以上。四期計劃投資50億元,聯合頭部企業打造綠電直供及算網協同的智算園區,目標總算力超20000P。
據《信創頭條》報道,該項目已簽約的國產算力部分總計1747臺設備、22832張算力卡,總算力達3479P(PetaFLOPS)。其中:
阿里云簽約1024臺設備、16384張平頭哥算力卡,總算力1945P,為所有品牌中最大訂單;
中科院簽約512臺設備、4096張沐曦算力卡,算力984P;
北京京儀簽約83臺設備、1328張壁仞算力卡,算力450P;
中昊芯英簽約128臺設備,算力200P。
此外,擬簽約項目算力達2002P,涉及太初元碁、燧原科技、摩爾線程等品牌。
公開資料獲悉,平頭哥半導體有限公司于 2018 年 9 月宣布成立,是阿里巴巴集團的全資半導體芯片業務主體。平頭哥擁有端云一體全棧產品系列,涵蓋數據中心芯片、IoT 芯片等,官方已列出的產品包括倚天 710、鎮岳 510、含光 800、羽陣 600、羽陣 611。
其中,含光 800 是平頭哥發布的首顆數據中心芯片,也是一顆高性能人工智能推理芯片,采用平頭哥自研架構,基于 12nm 工藝,集成 170 億晶體管,算力可達 820 TOPS。在業界標準的 ResNet-50 測試中,推理性能達到 78563 IPS,能效比達 500 IPS / W。
9月17日,截至發稿,阿里巴巴港股漲3.45%,報每股158.8港元,總市值重回3萬億港元。
未來展望
央視此次“意外”展示,標志著國產算力芯片已從“可用”邁向“好用”,正在“撕裂英偉達鐵幕的一道關鍵裂縫”。平頭哥PPU在顯存、帶寬、能效等關鍵指標上的突破,不僅打破了英偉達NVLink的互聯壟斷,也為國產大模型訓練提供了更具性價比的替代方案。
盡管CUDA生態仍是巨大壁壘,但PPU通過軟硬協同、場景優化和成本優勢,正逐步構建自己的護城河。全國各地的國有算力樞紐被要求在芯片采購中有超過50%來自國內廠商,以支持本土半導體產業的發展。
之前據Bernstein最新報告指出,中國將在2025年投入910億美元用于AI相關資本支出。其中,380億美元將用于采購國產AI芯片,顯現出國家層面強烈的本土化替代趨勢。在2024年中國AI芯片市場中,Bernstein Research以銷售金額口徑統計,英偉達的市占率約為66%,華為海思約為23%,AMD約為5%,寒武紀、摩爾線程、沐曦股份約為1%。此次三江源項目的規模化簽約,也表明國產AI芯片已獲得國家級算力基礎設施的認可。
此外,值得關注的是,國家市場監督管理總局在9月15日宣布對英偉達公司實施進一步調查,因其違反《中華人民共和國反壟斷法》。這一舉措無疑為國產算力芯片的發展提供了更為有利的市場環境。
