AI芯片+AI服務器,受益于AIGC+類GPT等應用的鯰魚效應,帶來約百倍算力需求。原有英偉達等供給有限(根據(jù)IDC咨詢,預測2025年AI服務器市場空間僅僅318億美元,預計21-25年CAGR僅僅19.5%),因此國產AI芯片在邏輯上有爆發(fā)彈性,此外AI服務器也有成長空間。
人工智能芯片主要分為“訓練(Training)”芯片和“推理(Inference)”芯片。從技術架構來看,AI芯片主要分為圖形處理器(GPU)、現(xiàn)場可編程門陣列(FPGA)、專用集成電路(ASIC)、中央處理器(CPU)四大類。其中,GPU是較為成熟的通用型人工智能芯片,F(xiàn)PGA和ASIC則是針對人工智能需求特征的半定制和全定制芯片,GPU、FPGA、ASIC作為加速芯片協(xié)助CPU進行大規(guī)模計算。
三類芯片用于深度學習時各有優(yōu)缺點:
(1)通用性:GPU>FPGA>ASIC,通用性越低,代表其適合支持的算法類型越少。
(2)性能功耗比:GPU<FPGA<ASIC,性能功耗比越高越好,意味著相同功耗下運算次數(shù)越多,訓練相同算法所需要的時間越短。
目前AI芯片主要被國際廠商壟斷,根據(jù)Counterpoint、IDC數(shù)據(jù),Intel和AMD共計占2022年全球數(shù)據(jù)中心CPU市場收入的92.45%,Nvidia占2021年中國加速卡市場份額的80%以上。
在不同的應用場景之下,已經形成了不同的AI芯片競爭格局。
1.云和數(shù)據(jù)中心AI芯片市場
在云和數(shù)據(jù)中心AI芯片市場,“訓練”和“推理”兩個環(huán)節(jié)都是英偉達GPU一家獨大,幾乎占據(jù)90%以上份額,包括AWS、微軟Azure、谷歌云、阿里云、華為云、騰訊云在內的大部分公有云廠商上線的AI加速計算公有云服務絕大部分都是基于英偉達Tesla系列GPU。
(1)云端訓練
云端訓練用的幾乎全部是英偉達GPU,公有云廠商中僅谷歌云一家除了提供以英偉達GPU為主的云計算加速服務之外,還推出了基于自研AI芯片TPU的深度學習訓練服務;
(2)云端推理
云端推理目前出現(xiàn)了基于GPU、FPGA、ASIC三種不同芯片云計算服務,但是市場份額仍然以英偉達GPU為主,其中AWS、阿里云、騰訊云、華為云等公有云廠商均推出了FPGA加速計算云服務,另外AWS推出了基于自研AI芯片Inferentia的ASIC加速計算服務,華為云推出了基于自研AI芯片昇騰310的ASIC加速計算服務。
2.設備端和邊緣計算“推理”市場
在設備端和邊緣計算“推理”市場,各類型芯片各自為陣,尚無絕對優(yōu)勢地位的芯片廠商出現(xiàn)——手機市場以高通、華為、蘋果原主控芯片廠商為主,自動駕駛、安防IPC領域英偉達暫時領先。
(1)國產CPU加速追趕
全球服務器CPU市場目前被Intel和AMD所壟斷,國產CPU在性能方面與國際領先水平仍有差距。根據(jù)Counterpoint數(shù)據(jù),在2022年全球數(shù)據(jù)中心CPU市場中,Intel以70.77%的市場份額排名第一,AMD以19.84%的份額緊隨其后,剩余廠商僅占據(jù)9.39%的市場份額,整體上處于壟斷局面;目前國內CPU廠商主有海光信息、海思、飛騰、龍芯中科、申威等。通過產品對比發(fā)現(xiàn),目前國產服務器CPU性能已接近Intel中端產品水平。
值得一提的是,龍芯CPU從指令集、IP核、芯片模塊等完全自主設計,目前基于LoongArch(龍架構)的第四范式Sage AIOS平臺已完成與龍芯3C5000系列芯片的深度適配。通過軟硬件協(xié)同調優(yōu),邏輯回歸、決策樹模型、深度稀疏神經網絡等機器學習算法在龍芯3C5000系列上的性能,接近某國外主流CPU的水平。
龍芯中科CPU方案推薦
龍芯中科設計推出軌道交通專用無風扇ECU,整機采用龍芯3號CPU,板貼4G DDR4內存顆粒,最大支持8G。支持3*VGA+1*LVDS顯示接口,最大支持4路獨立顯示。支持14個COM,6個USB,2個RJ45千兆網口,24路DIO。支持DC 9-36V寬壓輸入。該設備可廣泛應用于軌道交通、輕軌和高鐵行業(yè)各種自助售檢票系統(tǒng)、屏蔽門等場景。
龍芯3號工控機
全球GPU芯片市場主要由海外廠商占據(jù)壟斷地位,國產廠商加速布局。全球GPU市場被英偉達、英特爾和AMD三強壟斷,英偉達憑借其自身CUDA生態(tài)在AI及高性能計算占據(jù)絕對主導地位;國內市場中,景嘉微在圖形渲染GPU領域持續(xù)深耕,另外天數(shù)智芯、壁仞科技、登臨科技等一批主打AI及高性能計算的GPGPU初創(chuàng)企業(yè)正加速涌入。
(3)FPGA/ASIC國產替代正當時
FPGA全球市場呈現(xiàn)“兩大兩小”格局,Altera與Xilinx市占率共計超80%,Lattice和Microsemi市占率共計超10%;整體來看,安路科技、紫光同創(chuàng)等廠商處于國際中端水平,仍需進一步突破。工藝制程方面,當前國產廠商先進制程集中在28nm,落后于國際16nm水平;在等效LUT數(shù)量上,國產廠商旗艦產品處于200K水平,僅為XILINX高端產品的25%左右。
ASIC不同于CPU、GPU、FPGA,目前全球ASIC市場并未形成明顯的頭部廠商,國產廠商快速發(fā)展;通過產品對比發(fā)現(xiàn),目前國產廠商集中采用7nm工藝制程,與國外ASIC廠商相同;算力方面,海思的昇騰910在BF16浮點算力和INT8定點算力方面超越Googel最新一代產品TPUv4,遂原科技和寒武紀的產品在整體性能上也與Googel比肩。未來國產廠商有望在ASIC領域繼續(xù)保持技術優(yōu)勢,突破國外廠商在AI芯片的壟斷格局。
END