擺脫Nvidia算力制約?OpenAI發布自研智能處理器Jalapeño 創下9個月極速研發紀錄
OpenAI聯同博通(Broadcom)推出首款自研AI推理晶片「Jalapeño」,標誌住公司邁向硬件自研嘅重要一步。呢款專為大語言模型(LLM)推理設計嘅ASIC晶片,由研發到試產僅用九個月,並利用咗自身AI模型輔助設計。官方表示其每瓦特性能超越現有技術,預計2026年底於大型數據中心部署,旨在降低對外部晶片嘅依賴,提升服務運算效率並降低長遠運作成本。
OpenAI首款自研AI推理晶片Jalapeño正式亮相 聯手博通打造全棧架構 預計2026年底投入部署
人工智慧巨頭OpenAI喺美國時間星期三正式對外公布,同半導體大廠博通(Broadcom)合作研發出首款晶片,名為「Jalapeño」。呢款產品被OpenAI定義為「智能處理器」(Intelligence Processor),係專門為大語言模型(LLM)嘅推理(Inference)運作而由零開始設計嘅專用集成電路(ASIC)。
根據官方透露嘅消息,Jalapeño由最初嘅概念設計到成功完成流片(Tape-out),成個研發週期僅僅用咗九個月時間,寫下高效能半導體開發嘅新紀錄。呢個計畫亦得到另一間代工製造商Celestica嘅參與,負責電路板、機架系統整合。OpenAI計畫喺2026年底開始,將呢款晶片大規模部署喺同微軟(Microsoft)等夥伴合作嘅吉瓦(Gigawatt)級別數據中心入面,展開多世代運作平台嘅第一步。

深入解析Jalapeño技術核心:ASIC與推理優化
要理解Jalapeño嘅技術突破,首先需要分清楚AI運算入面嘅「訓練」(Training)同「推理」(Inference)有邊啲分別。
AI訓練係指將海量數據輸入到模型入面,等模型學習點樣去理解、判斷同回應,呢個過程需要極其龐大嘅並行運算能力,目前市場上主要依賴Nvidia嘅GPU嚟完成。而「推理」則係指當模型訓練好之後,面對用戶日常輸入嘅指令(例如用戶喺ChatGPT問問題、或者叫Codex寫程式碼)時,系統實時運算並給出答案嘅過程。
Jalapeño正正係一款百分之百為大語言模型推理而生嘅ASIC晶片。通用型嘅加速器(好似傳統GPU)為咗兼顧唔同嘅運算任務,往往要保留好多複雜嘅架構。而OpenAI呢次選擇由零開始設計,完全係基於日常營運ChatGPT、Codex同未來智能代理(Agent)背後積累嘅深厚數據。
研發團隊將優化重點放喺減少數據搬移(Data Movement)之上,並且將運算單元、內存(Memory)同網絡(Networking)資源做到高度平衡。早期嘅實驗室測試顯示,Jalapeño喺執行機器學習任務嘅時候,能夠喺目標工作頻率同功耗下穩定行駛,當中包括咗仲未正式發布嘅「GPT-5.3-Codex-Spark」模型。OpenAI硬件項目負責人Richard Ho指出,晶片架構貼近大語言模型運作內核,令實際運算效率可以極度接近硬件嘅理論極限值。
算力每瓦特表現卓越 聯手博通突破網絡樽頸
節能與網絡頻寬係現時大型數據中心面對嘅兩大難題。OpenAI雖然目前仲量度緊Jalapeño嘅最終量產效能,外間亦關注其最終產出表現,但早期嘅測試數據已經顯示,呢款晶片嘅「每瓦特效能」(Performance per watt)明顯優於目前市場上頂尖嘅同類產品。
喺大規模AI基礎設施入面,功耗直接決定咗營運成本同散熱架構嘅難度。Jalapeño透過精簡非必要嘅指令集,將能源高度集中喺大語言模型嘅矩陣運算入面,從而創造出極高嘅能源效益。
除咗晶片本身嘅架構之外,博通(Broadcom)喺呢個項目入面扮演咗至關重要嘅角色。博通除咗提供半導體設計落地嘅專業知識,更將旗下頂尖嘅Tomahawk網絡晶片技術融入到呢個平台入面。
當成千上萬塊Jalapeño晶片需要協同工作去應付全球用戶嘅請求時,晶片同晶片之間、機架同機架之間嘅網絡傳輸速度就會變成決定成敗嘅樽頸。透過博通嘅高速網絡解決方案,Jalapeño平台可以實現超低延遲同超高吞吐量,令互動式AI產品喺面對海量流量時,依然能夠保持近乎即時嘅回覆速度。
打造「全棧」生態圈 擺脫對單一供應商依賴
過去幾年,全球AI產業嘅發展節奏喺好大程度上受到Nvidia GPU供應量嘅制約。由於市場需求過於龐大,晶片交期漫長且價格高昂,令到各大科技巨頭都積極尋找替代方案。
OpenAI推出Jalapeño,最核心嘅戰略意圖就係建立「全棧」(Full-Stack)掌控力。現時OpenAI嘅業務已經覆蓋咗最前端嘅用戶產品(ChatGPT)、中層嘅基座模型(如GPT系列),而隨住Jalapeño嘅誕生,佢哋成功將觸角延伸到最底層嘅硬件基礎設施。
擁有全棧優化能力嘅優勢在於,OpenAI嘅軟件工程師喺開發新模型(例如未來嘅GPT-5.6)嘅時候,可以同硬件團隊緊密配合。軟件可以因應硬件嘅特性去調整算法內核,硬件亦可以根據新模型嘅特徵去修改電路設計。
呢種高度一體化嘅模式可以形成一個強大嘅商業飛輪(Flywheel):更好嘅基礎設施帶來更高嘅算力效率,算力效率提高就會令模型訓練同推理嘅成本下降,成本下降就能夠提供更平、更快嘅AI產品畀用戶,用戶增加進一步帶來更多收益,最終等公司有更多資金再投入下一代硬件嘅研發。長遠而言,呢個循環可以令高級AI服務變得更加普及同平民化。
AI模型反哺硬件設計 九個月流片寫下業界紀錄
半導體行業向來以研發週期長、投入資金大著稱。一款全新架構嘅高效能ASIC晶片,由設計到交畀晶圓廠進行流片,通常需要兩到三年嘅時間。然而,Jalapeño僅僅用咗九個月就完成咗呢個過程。
根據OpenAI公布嘅細節,呢次能夠寫下歷史紀錄嘅速度,除咗歸功於博通強大嘅工程落地能力之外,仲有一個極具科幻色彩嘅原因:OpenAI利用咗自己現有嘅AI模型去協助晶片嘅設計同優化工作。
喺晶片設計嘅過程入面,佈線優化(Routing Optimization)、模擬測試同邏輯驗證需要耗費工程師大量嘅時間去反覆嘗試。OpenAI將呢啲高難度嘅工程任務交畀AI模型去處理,透過AI嘅強大分析能力,迅速搵出效率最高嘅電路布局方案。
呢種「用現有AI去設計未來AI晶片」嘅模式,唔單止大幅縮短咗研發時間,亦向科技界展示咗AI喺工業設計同尖端製造領域嘅實用價值。當AI可以幫助工程師設計出更好、更平嘅晶片時,成個科技產業嘅運算成本都有望進一步降低。
算力自主化對大中華及亞太區企業嘅啟示
雖然Jalapeño主要係部署喺OpenAI同微軟位於歐美嘅大型數據中心,但呢次硬件革命對香港、台灣以及新加坡等華人地區嘅科技發展同企業應用,同樣帶嚟咗好深刻嘅啟示。
第一,全球AI應用正由「模型大戰」轉向「成本與效率大戰」。過去兩年,好多香港同亞太區嘅企業喺引入AI系統(例如客戶服務聊天機器人、自動化文案生成)嘅時候,最主要考慮嘅係模型聰唔聰明、答得準唔準。但隨住技術成熟,營運成本變成咗可否長遠落地嘅關鍵。OpenAI自研推理晶片,正正話畀市場聽,邊個可以將每一次日常推理嘅成本壓到最低,邊個就能夠喺商業市場入面贏到最後。
第二,「軟件與硬件共同設計」(Co-design)將會成為新常態。對於本地嘅科技研發團隊或大型企業IT部門嚟睇,未來唔應該再將硬件當作純粹嘅採購對象,而係要思考點樣令自己開發嘅系統,去適應唔同晶片(例如ASIC或特定雲端加速器)嘅底層架構。透過深度優化,就算唔用最貴嘅通用GPU,一樣可以喺特定業務場景入面發揮出極高嘅性價比。
第三,雲端服務嘅計費模式有望迎來調整。隨住高效能、低功耗嘅自研推理晶片投入服務,未來各大雲端平台提供AI API嘅收費(例如按每百萬個Token計費)好大機會有進一步下調嘅空間。呢個趨勢對於缺乏預算購買昂貴硬件嘅本地中小企同初創公司嚟講,無疑係一個降低創新門檻嘅正面訊號。
其他附加基本資料與事實整理
為咗等各位讀者更清晰理解Jalapeño喺目前全球AI晶片市場嘅定位,以下整理咗現時幾大科技巨頭自研晶片與行業龍頭Nvidia嘅最新發展現況與對比:
OpenAI - Jalapeño
- 主要定位:專門針對大語言模型(LLM)推理優化嘅專用ASIC。
- 核心優勢:由零開始設計,每瓦特性能表現卓越,深度整合博通Tomahawk網絡技術。
- 部署進度:目前於實驗室運行工程樣片,預計2026年底開始喺合作數據中心規模化部署。
Nvidia - Blackwell系列
- 主要定位:通用型高性能GPU加速器,兼顧AI訓練與推理。
- 核心優勢:擁有全行業最成熟嘅CUDA軟件生態圈,整體綜合算力與市佔率依然穩居全球首位。
- 市場現況:博通執行長陳福陽(Hock Tan)指出,Jalapeño喺特定推理任務上嘅表現可以媲美Blackwell,但Nvidia喺通用訓練與龐大生態圈上依然保持領先。
Google - TPU (Tensor Processing Unit)
- 主要定位:歷史悠久嘅自研AI加速器,涵蓋訓練同推理。
- 核心優勢:經過多代演進,技術成熟,與Google Cloud平台深度整合。
- 市場現況:Google已經將其廣泛應用於自家搜尋引擎、Gemini模型運作,係目前最成功嘅自研晶片案例之一。
微軟 (Azure Maia)、Meta (MTIA)、亞馬遜 (Trainium/Inferentia)
- 主要定位:雲端服務巨頭各自推出嘅客製化AI晶片。
- 核心優勢:降低自身雲端基礎設施嘅租用與採購成本。
- 市場現況:雖然呢幾間公司都推出咗自研硬件,但喺整體通用運算效能方面,目前依然落後於Nvidia嘅頂級產品,主要作為輔助或內部特定任務使用。
總結
Jalapeño嘅亮相毫無疑問為全球AI算力市場投下一枚震撼彈。雖然呢款晶片目前仲處於實驗室測試與早期量產準備階段,距離2026年底嘅正式部署仲有一段時間,且最終嘅量產良率、大規模集群營運嘅穩定性,以及配套軟件編譯器嘅成熟度,依然有待時間同實際市場環境去檢驗。
不過,從長遠嘅科技發展趨勢嚟睇,OpenAI由單純嘅軟件與模型研發商,跨足到最底層嘅硬件晶片架構設計,代表住未來頂尖AI企業嘅競爭將會係全方位嘅全棧對決。對於一般用戶而言,呢種競爭有望喺未來幾年帶來反應更快、費用更相宜、且功能更強大嘅人工智能互動體驗。