AI推理時代來臨:從GPU到ASIC的晶片技術與生態競逐

摘要

2025年隨著AI Inference需求大幅擴展,各大GPU供應商接連推出針對Inference Prefill階段設計的AI晶片,例如NVIDIA Rubin CPX、Intel Crescent Island、Qualcomm AI200;此外,中國華為也推出Prefill專用ASIC Ascend 950PR。然而,即使Google、AWS、Meta、Microsoft等四大CSP皆已推出Inference應用的ASIC,仍未推出針對Prefill階段的ASIC。

因此本篇報告主要深度解析:(1)目前ASIC開發進度;(2) ASIC與GPU能效比較;(3) Inference對AI晶片的規格要求;(4)目前Inference Prefill晶片發展;(5) Inference應用的ASIC技術規格展望。期能為廠商與投資人解析在Inference應用擴增背景下ASIC的市場發展方向。

一. 目前ASIC開發進度
二. ASIC與GPU能效比較
三. Inference對AI晶片規格要求
四. 目前Inference Prefill晶片發展
五. Inference應用的ASIC技術規格展望
六. 拓墣觀點

圖一 AI晶片能效比趨勢
圖二 Scaling Law三階段
圖三 SPAD架構示意圖
圖四 NVIDIA Rubin CPX結構
圖五 VR NVL144 CPX Compute Tray
圖六 華為Ascend 950PR
圖七 Intel Crescent Island
圖八 Qualcomm AI200

表一 2024~2027年AI晶片Roadmap
表二 2026~2028年ASIC設計服務商預計取得專案
表三 主要AI晶片算力與能效比
表四 Prefill與Decode比較
表五 目前已公布Inference AI晶片列表
表六 AI晶片規格演進

 

AI推理時代來臨:從GPU到ASIC的晶片技術與生態競逐

請輸入您的會員帳號與密碼,即可瀏覽全文

Login 如何購買 下載完整報告檔案 1.33MB PDF

會員專屬
您好,該資料屬會員權益方可瀏覽,您需成為會員且購買此產業項目權限才可觀看,詳細說明如下:
  • 拓墣產業研究院之「產業資料庫」為付費的會員服務,若您尚未具備會員身份,歡迎您申請加入或是與我們的客服聯絡瞭解。
  • 若您所屬公司機關已具有拓墣會員身份,並且設定予貴公司人員線上申請,請先行移至「申請會員帳號」填寫申請資料後送出,我們會儘快為您審核辦理。若未開放線上申請,請您詢問貴公司的承辦連絡人處理,謝謝。
  • 由於貴公司無採購此產業項目,因此您將無法瀏覽此篇文章,欲查詢貴公司所購買的產業項目明細,請至「會員權益」查詢,謝謝。
  • 客戶服務專線: 02 8978-6498 ext.822
    客戶服務信箱:

宣傳推廣

新聞稿

消費性電子與AI新品激勵,3Q25前十大晶圓代工產值季增8.1%

根據TrendForce最新調查,2025年第三季全球晶圓代工產業持續受AI高效能運算(H [...]

1Q26記憶體漲勢續強,手機、筆電品牌啟動價格上修與規格降級

根據TrendForce最新調查,由於預期2026年第一季記憶體價格將再顯著上漲,全球終端 [...]

中國CSP、OEM可望積極採購H200,惟本土AI晶片自研腳步持續加快

H200因效能明顯優於H20,出口中國可望吸引當地CSP、OEM採購 &nbsp [...]

人型機器人發展策略各異:日、台重提升零組件技術,美、中擴大整機應用

在全球各主要經濟體持續推動人型機器人發展趨勢下,日本廠商持續精進傳動、感測、控制等關鍵零組 [...]

AI 資料中心引爆光通訊雷射缺貨潮,Nvidia 策略性固樁重塑雷射供應鏈格局

根據TrendForce最新研究,隨著資料中心朝大規模叢集化發展,高速互聯技術成為決定AI [...]