亚洲色大成网站www-少妇性bbb搡bbb爽爽爽欧美-久久久久爽爽爽爽一区老女人-人妻丰满熟妇av无码区-欧性猛交ⅹxxx乱大交

歡迎訪問深圳市中小企業公共服務平臺電子信息窗口

大模型由OpenAI引爆,算力則是英偉達的“拿手戲”

2024-04-08 來源:賢集網
3102

關鍵詞: 英偉達 AI芯片 晶體管

北京時間3月19日凌晨,全球芯片巨頭英偉達(NVIDIA)公司召開了一年一度的 GTC 大會,公司創始人兼首席執行官黃仁勛發表演講,正式宣布將推出用于萬億參數級生成式AI的NVIDIA Blackwell架構及搭載Blackwell技術的B200和GB200系列芯片,將人工智能的計算能力推向了前所未有的高度。

在規格和性能方面,英偉達的新一代超級AI芯片顯示出顯著的進步。據會上介紹,上一代H100/H200芯片有800億個晶體管,而B200擁有2080億個晶體管。晶體管是集成電路的基本組件,更多的晶體管可以處理更多的數據,執行更復雜的計算,從而提供更高的性能。B200采用允許更小的晶體管尺寸和更高的集成度的臺積電4NP工藝制程,可以支持多達10萬億個參數的AI大模型來進行更高級的自然語言處理、圖像識別和復雜的數據分析任務。GB200芯片將兩個B200 Blackwell GPU與一個基于Arm架構的Grace CPU進行配對,兩塊芯片之間的互聯速度高達10TBps,這種設計結合了GPU的強大并行處理能力和CPU的高效序列處理能力。



在能效方面,Blackwell芯片架構也有顯著改進,黃仁勛舉例如果要訓練一個1.8萬億參數量的GPT模型,在沒有使用Blackwell技術的情況下,需要連續運行90天,使用8000張Hopper GPU,并消耗15兆瓦的電力。但如果使用了Blackwell GPU,只需要2000張芯片,而且只需消耗四分之一的電力,大約4兆瓦,就可以完成同樣的任務。Blackwell芯片架構的能效改進意味著在處理大規模AI模型訓練時,可以實現更高的性能和更低的能源消耗,這對于可持續發展具有重要意義。

在當前人工智能快速發展的背景下,對于計算能力的需求也日益增長。從自動駕駛汽車到智能醫療診斷,再到大規模數據分析、數字孿生等,沒有哪一項不在渴求更高的處理速度和更低的能耗。


大語言模型助推 GPU 算力需求增長

市場對 3D 圖像處理和 AI 深度學習計算等需求不斷增加,GPU 市場保持高增 速。據 Global Market Insights 的數據,全球 GPU 市場預計將以 CAGR 25.9%持 續增長,至 2030 年達到 4000 億美元規模。在 GPU 市場中,NVIDIA 依靠在深 度學習、人工智能等領域布局的先發優勢并憑借其優異產品性能以及成熟的生態 平臺長期處于領導地位,根據 JPR 數據,2022 年 Q1,NVIDIA 的在獨顯市場份 額約為 78%。

大語言模型有望拉動 GPU 需求增量,我們測算 23/24/25 年大模型有望貢獻 GPU 市場增量 69.88/166.2/209.95 億美元。具體假設測算如下: 訓練端,近年來各大廠商陸續發布大模型,我們假設 23/24/25 年新增 5/10/15 個 大模型,根據 OpenAI 團隊于 2020 發表的論文《Scaling Laws for Neural Language Models》提出的計算方法,對于以 Transformer 為基礎的模型,假設模 型參數量為 N,單 Token 所需的訓練算力約為 6N。參考 OpenAI 團隊 2020 同年 發表的論文《Language Models are Few-Shot Learners》,GPT-3 模型參數量約為 1750 億個,Token 數量約為 3000 億個,近年發布的模型均在千億級參數級別, 因此我們中性假設 23 年新增大模型平均參數量約為 2000 億個,Token 數量約為 3000 億個,兩者后續每年以 20%增速增加。另外假設單次訓練耗時約 30 天,算 力效率為 30%,后續伴隨算法精進,算力效率預計逐漸提升。以目前主流的訓練 端 GPU 英偉達 A100 測算,假設 ASP 為 1 萬美元,23/24/25 年全球訓練端 GPU 需求市場規模預計分別為 0.74/2.00/4.07 億美元。

推理端,基于訓練端的假設,根據論文《Scaling Laws for Neural Language Models》,單 Token 所需的推理算力開銷約為 2N。則對于 GPT-3 模型,其單 Token 所需的推理算力開銷為 3500 億 FLOPs-S。假設單次最大查詢 Tokens 數為 1000(對應漢字約 300-500 字,英文約 750 詞),每人每天查詢 20 次。在并發用 戶數的估計上,我們參考國際主流社交媒體日活用戶數進行測算,根據 Dustin Stout 統計,Facebook、WhatsApp、Instagram 全球日活用戶數分別為 16 億、10 億、6 億,考慮到目前(類) GPT 平臺仍處于發展早期,我們預計全球大模型日活 用戶數在 23/24/25 分別為 2/6/10 億,按照所有用戶平均分布于 24 小時,并以 10 倍計算峰值并發數量。以目前英偉達用于推理端計算的 A10 測算,假設 ASP 為 2800 美元,23/24/25 年全球推理端 GPU 需求市場規模預計分別為 69.14/164.2/205.88 億美元。




英偉達GPU何以獨霸市場?

GPU成為AI計算的標配,其中最大的贏家非英偉達莫屬,在AI計算領域英偉達的GPU幾乎占到市場的絕大部分,英特爾和AMD等芯片巨頭也幾乎都錯過了這一波AI浪潮的紅利。英偉達做對了什么?英特爾與AMD緣何錯過GPU需求爆發的市場機會?

2006年英偉達推出CUDA,帶來了靈活便捷的GPU編程手段,這為使用GPU完成AI計算創造了良好的條件。2014年英偉達發布cuDNN V1.0深度神經網絡加速庫,并集成進了Caffe等AI框架中,進一步為基于英偉達GPU的AI計算提升性能和易用性等,使得AI開發和研究人員可以更加專注于神經網絡結構的設計等。2016年英偉達推出的Pascal架構GPU產品,已經開始專門為AI計算場景,特別是推理計算場景,做了許多的定制和優化,能更好的滿足AI計算的需求,此外推出NVlink單機多卡的互聯技術,增加了GPU之間通信的帶寬,也加速了多卡并行計算的效率。2017年英偉達在Volta架構系列GPU中引入TensorCore,使得英偉達GPU產品在AI計算的訓練場景的性能繼續提升。2020年英偉達又推出新一代Ampere架構的GPU產品,在算力和性能等又大幅提升。

目前在AI計算場景下,英偉達GPU已經成為最主流的選擇,從整個發展過程中可以看到英偉達在軟硬件方面的所做的努力也密不可分,并且從2014年開始英偉達在AI方面每一次布局都剛好恰到好處。CUDA的推出可能為2011年前后發現GPU在AI計算中10-60倍的加速效果創造有利條件;2014年推出的cuDNN,并集成進Caffe等AI框架,在軟件層面進一步增加了英偉達GPU的易用性等;2016年開始直接在芯片層面全面支持AI計算場景需求,后續的產品在算力和性能等方面的提升正好又迎合了AI技術和產業發展的大趨勢。

再看另外兩家芯片巨頭英特爾和AMD,這兩家都有非常強大的實力,按理說應該也能在這一波AI浪潮取得巨大紅利,但事實上卻并沒有。當然因為AI的發展帶動CPU采購肯定也給英特爾和AMD帶來了不少收益。過去10年中,英特爾并沒有專門針對AI計算推出相應的產品,不論學界還是業界有AI方面新的研究成果,英特爾可能都會跟進在CPU上進行一些優化,聲稱在GPU上的性能只比在CPU上快2-3倍左右,并沒有像其他地方所說的幾十倍上百倍的效果。在AI計算效率等方面,英特爾在CPU上優化后確實能夠縮小與GPU的差距,但這種優化的思路在業界并沒有太多的跟隨者,主要是優化工作本身的門檻相對較高。

AMD在過去十多年中CPU一直被英特爾壓著,無暇顧及GPU市場的更多需求,雖然AMD的GPU在游戲市場也不錯,但在AI計算方面始終沒有形成氣候。當然2018年前后AMD新架構的CPU產品面世之后,最近幾年大有反超英特爾的架勢,不久前AMD推出的Instinct MI100的GPU產品不知道是否會在AI計算領域挑戰英偉達的地位,讓我們拭目以待。


國產GPU該如何破局?

國內這一批GPU方面的創業公司主要都是在過去3年內成立,如沐曦、壁仞、摩爾線程等等,并且不少已經完成了幾十億元的融資,今年下半年或者明年這些家國產GPU廠商的產品估計也都差不多能推向市場。面對已經占據市場絕對主導地位的英偉達,以及強勢入場的英特爾和AMD,國產GPU產品如何破局,才能在市場中占得一席之地?



中美貿易戰以及最近的俄烏戰爭中西方對俄羅斯的制裁,對于國有GPU產品的采納有重要的作用。回顧過去20年國產CPU產品的發展,由于英特爾和AMD的CPU產品的性價比較高,國產CPU產品此前一直未成氣候,中美貿易戰之后,信創產品的需求帶動了國產CPU產品的發展。在當前的社會大背景下,國產GPU產品也有很大的用武之地,對于每一個國產GPU的廠商而言都是重大的機遇。

國產GPU產品短期內要跟英偉達等巨頭抗衡估計難度比較大,因此在后續的發展路徑中,建議是先積極擁抱信創產品體系,積極開展與地方政府或者在關系國計民生的特定領域等部門等緊密合作,針對該具體領域與上下游服務商形成相應解決方案,先保證能在市場中立足。只要在一個地方或一個領域占據優勢位置,應該足以在市場中立足,然后再圖更大的發展。

從英偉達GPU產品的成功案例中,國產GPU廠商也可以借鑒不少經驗,在商用領域可能第一步需要實現對英偉達CUDA等軟件生態的兼容,使得開發人員在實際使用過程中遷移成本最低,后續需要進一步增加在軟件平臺方面投入,不斷提升自身GPU產品的易用性等,并聯合更多的軟件生態企業不斷完善GPU和AI計算的軟硬件生態體系。如果主要幾個國產GPU廠商能聯合制定和推出一套類CUDA的標準體系可能,或許能夠對整個國產GPU產品的推廣會有一定的意義。



主站蜘蛛池模板: 亚洲色成人网一二三区| 日韩中文亚洲欧美视频二| 欧美xxxx做受欧美| 亚洲男同gv在线观看| 久久av老司机精品网站导航| 日韩做a爰片久久毛片a片| 国产人妖乱国产精品人妖| 午夜精品久久久久久99热| 国产精品h片在线播放| 夜夜躁很很躁日日躁麻豆| 熟女体下毛毛黑森林| 日韩精品内射视频免费观看| 丝袜美腿亚洲一区二区| 99re视频热这里只有精品7| 熟妇人妻无乱码中文字幕| 天天天天躁天天爱天天碰2018 | 香蕉久久久久久av成人| 亚洲 小说 欧美 激情 另类| 久久久久亚洲精品| 好了av四色综合无码| 精品亚洲aⅴ无码一区二区三区 | 内射合集对白在线| 波多野结衣乳巨码无在线观看 | 福利姬国产精品一区在线 | 熟妇人妻va精品中文字幕| 99e久热只有精品8在线直播| 闺蜜张开腿让我爽了一夜| 狠狠噜天天噜日日噜色综合| 蜜臀久久99精品久久久久久小说 | 久9re热视频这里只有精品| 尤物av无码色av无码| 大地资源网第二页免费观看 | 人妻中字视频中文乱码| 热久久国产欧美一区二区精品| 亚洲无码视频在线| 亚洲精品毛片av一区二区三区| 国产精品亚洲精品日韩己满十八小| 精品久久久久久777米琪桃花| 99久久国产露脸精品国产麻豆| 五月婷婷六月丁香动漫| 色综合 图片区 小说区|