By 5News編輯部 — 25 6月 2026

擺脫Nvidia算力制約？OpenAI發布自研智能處理器Jalapeño 創下9個月極速研發紀錄

OpenAI聯同博通（Broadcom）推出首款自研AI推理晶片「Jalapeño」，標誌住公司邁向硬件自研嘅重要一步。呢款專為大語言模型（LLM）推理設計嘅ASIC晶片，由研發到試產僅用九個月，並利用咗自身AI模型輔助設計。官方表示其每瓦特性能超越現有技術，預計2026年底於大型數據中心部署，旨在降低對外部晶片嘅依賴，提升服務運算效率並降低長遠運作成本。

OpenAI首款自研AI推理晶片Jalapeño正式亮相聯手博通打造全棧架構預計2026年底投入部署

人工智慧巨頭OpenAI喺美國時間星期三正式對外公布，同半導體大廠博通（Broadcom）合作研發出首款晶片，名為「Jalapeño」。呢款產品被OpenAI定義為「智能處理器」（Intelligence Processor），係專門為大語言模型（LLM）嘅推理（Inference）運作而由零開始設計嘅專用集成電路（ASIC）。

根據官方透露嘅消息，Jalapeño由最初嘅概念設計到成功完成流片（Tape-out），成個研發週期僅僅用咗九個月時間，寫下高效能半導體開發嘅新紀錄。呢個計畫亦得到另一間代工製造商Celestica嘅參與，負責電路板、機架系統整合。OpenAI計畫喺2026年底開始，將呢款晶片大規模部署喺同微軟（Microsoft）等夥伴合作嘅吉瓦（Gigawatt）級別數據中心入面，展開多世代運作平台嘅第一步。

OpenAI首款自研AI推理晶片Jalapeño正式亮相聯手博通打造全棧架構預計2026年底投入部署

深入解析Jalapeño技術核心：ASIC與推理優化

要理解Jalapeño嘅技術突破，首先需要分清楚AI運算入面嘅「訓練」（Training）同「推理」（Inference）有邊啲分別。

AI訓練係指將海量數據輸入到模型入面，等模型學習點樣去理解、判斷同回應，呢個過程需要極其龐大嘅並行運算能力，目前市場上主要依賴Nvidia嘅GPU嚟完成。而「推理」則係指當模型訓練好之後，面對用戶日常輸入嘅指令（例如用戶喺ChatGPT問問題、或者叫Codex寫程式碼）時，系統實時運算並給出答案嘅過程。

Jalapeño正正係一款百分之百為大語言模型推理而生嘅ASIC晶片。通用型嘅加速器（好似傳統GPU）為咗兼顧唔同嘅運算任務，往往要保留好多複雜嘅架構。而OpenAI呢次選擇由零開始設計，完全係基於日常營運ChatGPT、Codex同未來智能代理（Agent）背後積累嘅深厚數據。

研發團隊將優化重點放喺減少數據搬移（Data Movement）之上，並且將運算單元、內存（Memory）同網絡（Networking）資源做到高度平衡。早期嘅實驗室測試顯示，Jalapeño喺執行機器學習任務嘅時候，能夠喺目標工作頻率同功耗下穩定行駛，當中包括咗仲未正式發布嘅「GPT-5.3-Codex-Spark」模型。OpenAI硬件項目負責人Richard Ho指出，晶片架構貼近大語言模型運作內核，令實際運算效率可以極度接近硬件嘅理論極限值。

算力每瓦特表現卓越聯手博通突破網絡樽頸

節能與網絡頻寬係現時大型數據中心面對嘅兩大難題。OpenAI雖然目前仲量度緊Jalapeño嘅最終量產效能，外間亦關注其最終產出表現，但早期嘅測試數據已經顯示，呢款晶片嘅「每瓦特效能」（Performance per watt）明顯優於目前市場上頂尖嘅同類產品。

喺大規模AI基礎設施入面，功耗直接決定咗營運成本同散熱架構嘅難度。Jalapeño透過精簡非必要嘅指令集，將能源高度集中喺大語言模型嘅矩陣運算入面，從而創造出極高嘅能源效益。

除咗晶片本身嘅架構之外，博通（Broadcom）喺呢個項目入面扮演咗至關重要嘅角色。博通除咗提供半導體設計落地嘅專業知識，更將旗下頂尖嘅Tomahawk網絡晶片技術融入到呢個平台入面。

當成千上萬塊Jalapeño晶片需要協同工作去應付全球用戶嘅請求時，晶片同晶片之間、機架同機架之間嘅網絡傳輸速度就會變成決定成敗嘅樽頸。透過博通嘅高速網絡解決方案，Jalapeño平台可以實現超低延遲同超高吞吐量，令互動式AI產品喺面對海量流量時，依然能夠保持近乎即時嘅回覆速度。

打造「全棧」生態圈擺脫對單一供應商依賴

過去幾年，全球AI產業嘅發展節奏喺好大程度上受到Nvidia GPU供應量嘅制約。由於市場需求過於龐大，晶片交期漫長且價格高昂，令到各大科技巨頭都積極尋找替代方案。

OpenAI推出Jalapeño，最核心嘅戰略意圖就係建立「全棧」（Full-Stack）掌控力。現時OpenAI嘅業務已經覆蓋咗最前端嘅用戶產品（ChatGPT）、中層嘅基座模型（如GPT系列），而隨住Jalapeño嘅誕生，佢哋成功將觸角延伸到最底層嘅硬件基礎設施。

擁有全棧優化能力嘅優勢在於，OpenAI嘅軟件工程師喺開發新模型（例如未來嘅GPT-5.6）嘅時候，可以同硬件團隊緊密配合。軟件可以因應硬件嘅特性去調整算法內核，硬件亦可以根據新模型嘅特徵去修改電路設計。

呢種高度一體化嘅模式可以形成一個強大嘅商業飛輪（Flywheel）：更好嘅基礎設施帶來更高嘅算力效率，算力效率提高就會令模型訓練同推理嘅成本下降，成本下降就能夠提供更平、更快嘅AI產品畀用戶，用戶增加進一步帶來更多收益，最終等公司有更多資金再投入下一代硬件嘅研發。長遠而言，呢個循環可以令高級AI服務變得更加普及同平民化。

AI模型反哺硬件設計九個月流片寫下業界紀錄

半導體行業向來以研發週期長、投入資金大著稱。一款全新架構嘅高效能ASIC晶片，由設計到交畀晶圓廠進行流片，通常需要兩到三年嘅時間。然而，Jalapeño僅僅用咗九個月就完成咗呢個過程。

根據OpenAI公布嘅細節，呢次能夠寫下歷史紀錄嘅速度，除咗歸功於博通強大嘅工程落地能力之外，仲有一個極具科幻色彩嘅原因：OpenAI利用咗自己現有嘅AI模型去協助晶片嘅設計同優化工作。

喺晶片設計嘅過程入面，佈線優化（Routing Optimization）、模擬測試同邏輯驗證需要耗費工程師大量嘅時間去反覆嘗試。OpenAI將呢啲高難度嘅工程任務交畀AI模型去處理，透過AI嘅強大分析能力，迅速搵出效率最高嘅電路布局方案。

呢種「用現有AI去設計未來AI晶片」嘅模式，唔單止大幅縮短咗研發時間，亦向科技界展示咗AI喺工業設計同尖端製造領域嘅實用價值。當AI可以幫助工程師設計出更好、更平嘅晶片時，成個科技產業嘅運算成本都有望進一步降低。

算力自主化對大中華及亞太區企業嘅啟示

雖然Jalapeño主要係部署喺OpenAI同微軟位於歐美嘅大型數據中心，但呢次硬件革命對香港、台灣以及新加坡等華人地區嘅科技發展同企業應用，同樣帶嚟咗好深刻嘅啟示。

第一，全球AI應用正由「模型大戰」轉向「成本與效率大戰」。過去兩年，好多香港同亞太區嘅企業喺引入AI系統（例如客戶服務聊天機器人、自動化文案生成）嘅時候，最主要考慮嘅係模型聰唔聰明、答得準唔準。但隨住技術成熟，營運成本變成咗可否長遠落地嘅關鍵。OpenAI自研推理晶片，正正話畀市場聽，邊個可以將每一次日常推理嘅成本壓到最低，邊個就能夠喺商業市場入面贏到最後。

第二，「軟件與硬件共同設計」（Co-design）將會成為新常態。對於本地嘅科技研發團隊或大型企業IT部門嚟睇，未來唔應該再將硬件當作純粹嘅採購對象，而係要思考點樣令自己開發嘅系統，去適應唔同晶片（例如ASIC或特定雲端加速器）嘅底層架構。透過深度優化，就算唔用最貴嘅通用GPU，一樣可以喺特定業務場景入面發揮出極高嘅性價比。

第三，雲端服務嘅計費模式有望迎來調整。隨住高效能、低功耗嘅自研推理晶片投入服務，未來各大雲端平台提供AI API嘅收費（例如按每百萬個Token計費）好大機會有進一步下調嘅空間。呢個趨勢對於缺乏預算購買昂貴硬件嘅本地中小企同初創公司嚟講，無疑係一個降低創新門檻嘅正面訊號。

其他附加基本資料與事實整理

為咗等各位讀者更清晰理解Jalapeño喺目前全球AI晶片市場嘅定位，以下整理咗現時幾大科技巨頭自研晶片與行業龍頭Nvidia嘅最新發展現況與對比：

OpenAI - Jalapeño

主要定位：專門針對大語言模型（LLM）推理優化嘅專用ASIC。
核心優勢：由零開始設計，每瓦特性能表現卓越，深度整合博通Tomahawk網絡技術。
部署進度：目前於實驗室運行工程樣片，預計2026年底開始喺合作數據中心規模化部署。

Nvidia - Blackwell系列

主要定位：通用型高性能GPU加速器，兼顧AI訓練與推理。
核心優勢：擁有全行業最成熟嘅CUDA軟件生態圈，整體綜合算力與市佔率依然穩居全球首位。
市場現況：博通執行長陳福陽（Hock Tan）指出，Jalapeño喺特定推理任務上嘅表現可以媲美Blackwell，但Nvidia喺通用訓練與龐大生態圈上依然保持領先。

Google - TPU (Tensor Processing Unit)

主要定位：歷史悠久嘅自研AI加速器，涵蓋訓練同推理。
核心優勢：經過多代演進，技術成熟，與Google Cloud平台深度整合。
市場現況：Google已經將其廣泛應用於自家搜尋引擎、Gemini模型運作，係目前最成功嘅自研晶片案例之一。

微軟 (Azure Maia)、Meta (MTIA)、亞馬遜 (Trainium/Inferentia)

主要定位：雲端服務巨頭各自推出嘅客製化AI晶片。
核心優勢：降低自身雲端基礎設施嘅租用與採購成本。
市場現況：雖然呢幾間公司都推出咗自研硬件，但喺整體通用運算效能方面，目前依然落後於Nvidia嘅頂級產品，主要作為輔助或內部特定任務使用。

總結

Jalapeño嘅亮相毫無疑問為全球AI算力市場投下一枚震撼彈。雖然呢款晶片目前仲處於實驗室測試與早期量產準備階段，距離2026年底嘅正式部署仲有一段時間，且最終嘅量產良率、大規模集群營運嘅穩定性，以及配套軟件編譯器嘅成熟度，依然有待時間同實際市場環境去檢驗。

不過，從長遠嘅科技發展趨勢嚟睇，OpenAI由單純嘅軟件與模型研發商，跨足到最底層嘅硬件晶片架構設計，代表住未來頂尖AI企業嘅競爭將會係全方位嘅全棧對決。對於一般用戶而言，呢種競爭有望喺未來幾年帶來反應更快、費用更相宜、且功能更強大嘅人工智能互動體驗。

擺脫Nvidia算力制約？OpenAI發布自研智能處理器Jalapeño 創下9個月極速研發紀錄

OpenAI首款自研AI推理晶片Jalapeño正式亮相聯手博通打造全棧架構預計2026年底投入部署

深入解析Jalapeño技術核心：ASIC與推理優化

算力每瓦特表現卓越聯手博通突破網絡樽頸

打造「全棧」生態圈擺脫對單一供應商依賴

AI模型反哺硬件設計九個月流片寫下業界紀錄

算力自主化對大中華及亞太區企業嘅啟示