自駕車發展新方向:Uber 擬用數百萬司機車隊收集路況數據,解決行業樽頸
Uber 技術長近期透露最新戰略,計劃將旗下數百萬計嘅人類司機車輛配備感測套件,轉化為收集現實世界行車數據嘅龐大網絡。呢項名為「AV Labs」嘅延伸計劃,旨在為自動駕駛公司解決「真實數據不足」嘅發展樽頸。Uber 目前已同 25 間自駕車企業合作,建構「AV 雲端」系統,容許夥伴以無風險嘅「影子模式」測試 AI 模型。放棄自家造車後,Uber 正重新定位為自駕產業不可或缺嘅數據基礎設施供應商。
Uber 嘅自駕新戰略
最近,Uber 技術長 Praveen Neppalli Naga 喺三藩市一個名為 StrictlyVC 嘅科技論壇上,透露咗公司未來嘅長遠發展大計。Uber 嘅目標已經唔再局限於單純嘅載客服務,而係計劃為旗下數百萬名人類司機嘅車輛安裝感測套件,將呢啲車輛變成喺現實世界中不斷收集數據嘅「感測元件網格」(Sensor Grid)。呢啲收集返嚟嘅真實行車數據,將會提供畀自動駕駛(AV)公司,甚至其他需要用物理世界情境去訓練人工智能模型嘅企業。
呢個佈局顯示,自從幾年前放棄自家嘅自動駕駛研發部門之後,外界一直關注 Uber 喺未來自駕車時代會否面臨被淘汰嘅危機,而家 Uber 似乎已經搵到一個全新嘅突圍戰略:轉型成為整個自駕產業嘅「軍火商」同基礎設施供應商。
從叫車平台到龐大數據網絡
「AV Labs」計劃嘅擴張藍圖
根據 Praveen Neppalli Naga 嘅介紹,將人類司機車輛改裝成感測器網絡,其實係 Uber 喺今年一月下旬公佈嘅「AV Labs」計劃嘅自然延伸。目前,「AV Labs」仍然處於初期階段,主要依賴一小批由 Uber 自行營運、獨立於其司機網絡之外嘅專屬感測車隊嚟收集數據。
不過,技術長坦言,將設備安裝到廣大嘅司機車輛上先至係佢哋「最終想走嘅方向」。Uber 喺全球擁有數以百萬計嘅活躍司機,只要當中有一小部分願意讓車輛化身為「行動數據收集平台」,其產生嘅規模效應,將會遠遠超越任何一家單一自駕車公司所能夠自行部署嘅車隊數量。然而,實行呢個宏大計劃之前,Uber 仲需要克服唔少現實挑戰,特別係各地嘅監管法規。Naga 指出,公司必須先徹底了解感測套件嘅運作模式,同時要釐清美國各州甚至全球不同地區對「感測器定義」以及「數據共享」嘅法律界線。
解決自駕車行業最大樽頸:真實世界數據
點解 Uber 嘅數據對自駕車產業咁重要?Naga 直接點出咗行業現狀:當今自動駕駛發展嘅限制因素,早就已經唔係底層技術,而係「數據」。
以目前市場上領先嘅自駕車公司(例如 Waymo)為例,為咗訓練 AI 模型,佢哋必須花費龐大資金部署車隊到不同城市收集各式各樣嘅場景數據。但呢啲公司面臨嘅痛點係,佢哋缺乏足夠嘅資本同時間,去部署天文數字嘅車輛以收集所有極度碎片化、特定場景嘅資訊。
喺自動駕駛領域,有一種情況稱為「邊角案例」(Corner Cases),即係指嗰啲極度罕見、但發生時後果可以好嚴重嘅路況(例如:惡劣天氣下嘅突發交通意外、特定時間學校路口嘅複雜人流等)。單靠自駕車公司自己嘅小規模車隊,好難喺短時間內遇上並記錄足夠嘅邊角案例。而呢一點正正係 Uber 嘅絕對優勢。透過覆蓋全城、無孔不入嘅人類司機網絡,Uber 可以輕易獲取各種氣候、時段與罕見路況嘅真實數據,填補自駕車模型訓練中嘅空白。
深入探討:「AV 雲端」與影子模式測試
建立自駕車專用嘅龐大數據庫
為咗將呢啲數據商業化同系統化,Uber 目前已經同 25 間自駕車公司建立咗合作夥伴關係,當中包括總部位於倫敦嘅自動駕駛初創企業 Wayve。Uber 正在構建一個名為「AV 雲端」(AV Cloud)嘅系統。呢個雲端平台本質上係一個經過詳細標註嘅感測器資料庫。合作夥伴可以透過系統查詢所需嘅特定數據,用嚟完善同訓練佢哋自家嘅自動駕駛模型。
影子模式(Shadow Mode)嘅應用情境
除咗提供靜態數據,「AV 雲端」仲提供咗一個極具實用價值嘅測試環境——「影子模式」(Shadow Mode)。
喺呢個模式下,自駕車公司可以將佢哋訓練好嘅 AI 模型,接入到真實嘅 Uber 載客行程當中進行模擬運算。模型會喺後台默默接收人類司機車輛傳來嘅即時感測數據,然後預測「如果由我(AI)嚟揸,我會點樣做」。系統會將 AI 嘅判斷同真實世界中人類司機嘅實際操作進行對比。如果 AI 嘅判斷出現失誤(例如未能避開障礙物),呢次「虛擬意外」並唔會對現實世界造成任何影響,但 AI 就可以從中學習並修正錯誤。這種做法可以讓自駕系統喺完全無公共安全風險嘅情況下,累積大量實戰經驗。
附加基本資料:Uber 嘅自駕車發展歷史與挑戰
從放棄自家研發到重返賽道
回顧 Uber 嘅發展史,佢哋喺自動駕駛領域其實經歷過大起大落。早年,Uber 聯合創辦人 Travis Kalanick 曾經將自動駕駛視為公司生死存亡嘅關鍵,並投入巨資成立「先進技術集團」(Advanced Technologies Group, ATG)自行研發自駕車。然而,經歷咗連串技術樽頸、財務壓力,以及 2018 年喺亞利桑那州發生嘅致命交通意外後,Uber 最終喺 2020 年底將 ATG 業務出售畀自動駕駛初創公司 Aurora Innovation,正式退出「親自造車」嘅競賽。
當時唔少市場觀察家認為,無咗自己嘅自駕車,Uber 喺未來可能會被淘汰。但如今 Uber 改變策略,選擇成為數據提供者。呢個轉變被業界視為非常聰明嘅一步棋,因為佢哋避開咗造車嘅龐大硬件成本同安全風險,轉而發揮自己作為全球最大叫車平台嘅大數據優勢。
潛在挑戰:私隱問題與商業利益
雖然 Naga 喺訪問中強調,Uber 嘅目標「唔係想靠呢啲數據賺錢,而係想將數據民主化(Democratize it)」。但考慮到呢啲經過標註嘅真實世界數據具有極高嘅商業價值,呢個說法未來可能會面對市場考驗。
事實上,Uber 已經對多間自駕車企業進行咗股權投資。憑藉能夠大規模提供獨家訓練數據嘅能力,Uber 將會喺成個自駕產業鏈中掌握極大嘅話語權。因為目前大部分自駕車公司,仍然需要依賴 Uber 嘅叫車平台網絡先可以接觸到廣大嘅乘客群。
另一方面,將百萬計嘅車輛變成移動感測器,必然會引起公眾對私隱嘅關注。車內鏡頭如何處理乘客私隱?車外感測器收集到嘅途人面貌同車牌又會點樣匿名化?司機又能否從分享數據中獲得合理嘅利潤分成?呢啲都係 Uber 喺大規模推行「感測元件網格」之前,必須向公眾同監管機構交代清楚嘅核心問題。
總結
Uber 放棄自行研發自動駕駛汽車後,並無退出呢場科技競賽,反而搵到咗一個更符合自身優勢嘅戰略位置。透過推出「AV Labs」並計劃將百萬司機網絡轉化為數據收集平台,Uber 正在建構一個龐大嘅「AV 雲端」基礎設施。呢個舉動不僅能夠為合作夥伴提供極具價值嘅真實路況數據,解決行業長期面對嘅「邊角案例」痛點,更容許自駕企業透過「影子模式」進行安全有效嘅模型訓練。
雖然面臨各州法規以及私隱保護等挑戰,但 Uber 呢個轉型策略,確實為公司喺未來嘅自動駕駛生態圈中,確立咗一個難以被取代嘅核心地位。隨著技術與法規逐步完善,未來嘅道路上,每一架接載乘客嘅 Uber,可能同時都為全球自動駕駛技術嘅進化貢獻緊寶貴嘅數據。