免费涩涩18网站入口下载,日本三级香港三级三级人!妇久,人妻无码久久精品人妻,欧美片巜欲性高

當前位置: 首頁 文章

小鵬汽車啟動VLA基模研發,2億Clips訓練720億超大規模模型

駕仕派-太平洋號
仕聚一堂,言車馬之樂。
+ 關注

小鵬汽車在新X9發布上市之前,做了一場AI技術分享會,再次強調了自己是一家AI驅動的技術公司。而這次技術分享會的一個核心內容就是:小鵬汽車正在研發VLA基座模型,也在研發“世界模型”,而且小鵬汽車已經擁有10 EFLOPS的算力。

可以說,小鵬汽車整個智駕技術路線也已經向業界下一代主流路線VLA開始迭代。

1、正在研發的“小鵬世界基座模型”是一個720億參數的超大規模自動駕駛大模型,可以理解為一個VLA基座模型。據介紹,小鵬基模是一個以大語言模型為骨架網絡、使用海量優質駕駛數據訓練的多模態大模型,具備視覺理解能力、長思維鏈式推理能力(CoT)和動作生成能力,從而在充分理解現實世界的基礎上,能夠像人類一樣進行復雜的常識推理,并將推理結果轉化為行動。

2、需要強調的是,“小鵬世界基座模型”里面的“世界”只是一個修飾詞,并非是“World Model”的真實含義。但是小鵬之所以將新的基座模型稱為“世界基座模型”,或許是考慮到小鵬已經開始研發真正意義上的物理世界大模型。今后世界模型將作為“云端模型工廠”的重要一環,支持基座模型的性能優化,相當于世界模型是基座模型的訓練場。

3、此次小鵬汽車基座模型參數量達到了72B,是主流VLA模型的35倍左右。這個35倍我們猜測小鵬應該是對比友商的2.2B的VLM參數量來衡量的。之所以小鵬要研發超大規模的VLA基座模型,主要是因為他們已經初步驗證了VLA依然有規模法則(Scaling Law)效應——參數規模越大,模型的能力越強;同樣的模型大小,訓練數據量越大,模型的能力也會越強。

4、只有足夠強大的基座模型,才能夠被強化學習(Reinforcement Learning)充分激發上限,小鵬汽車已經逐步搭建了針對強化學習的模型訓練框架,包括2B、7B、72B,其訓練數據了從100萬Clips一直到2000萬Clips,最終為了滿足72B超大模型會用到2億Clips。

5、這里小鵬汽車專門提到,云端大模型的規模越大,從蒸餾出來的端側模型效果來說才會更好。未來,小鵬將通過云端蒸餾小模型的方式將基模部署到車端,最終可讓車端模型的性能超越車端算力“一畝三分田”的限制。強化學習和云端蒸餾等技術方案已經在DeepSeek上做了驗證,所以小鵬汽車很有信心。

6、小鵬汽車透露他們已經在后裝算力的車端成功以小尺寸基模實現了控車,盡管是非常早期的實車測試,但是結果依然讓人滿意。一個值得注意的細節是,小鵬強調了是“后裝算力”,這意味著要跑VLA基座模型還是需要更大算力。

7、有意思的是,小鵬汽車還提到一點:即便來到“大模型時代”,過去“規則時代”的領先經驗仍在發揮作用。在開發強化學習的獎勵模型(Reward Model)時,研發團隊基于規則經驗設計了獎勵函數,將規則時代的沉淀轉化為了訓練基座模型的生產力。這似乎是小鵬在強調其過去積累的經驗依然可以幫助他們實現繼續領先,而不完全是推倒重來。

8、最后是小鵬汽車已經著手開發世界模型(World Model)。小鵬的世界模型是一種實時建模和反饋系統,能夠基于動作信號模擬出真實環境狀態,渲染場景,并生成場景內其他智能體(也即交通參與者)的響應,從而構建一個閉環的反饋網絡,幫助基座模型不斷進化,逐漸突破過去“模仿學習”的天花板。

文|JackieLXX

圖|網絡

聲明:本文由太平洋號作者撰寫,觀點僅代表個人,不代表太平洋汽車。文中部分圖片來自于網絡,感謝原作者。
987
04-15
智駕大橫評

相關車系

更多>>

相關推薦

熱門文章

|
主站蜘蛛池模板: 舞钢市| 西贡区| 沧源| 贵州省| 那坡县| 铜山县| 三原县| 新竹县| 桂林市| 安仁县| 遵义市| 太湖县| 辽中县| 文成县| 余干县| 奉新县| 西昌市| 潜江市| 海城市| 新昌县| 上栗县| 泰宁县| 双鸭山市| 新余市| 巩义市| 讷河市| 阿城市| 闽清县| 邹城市| 广水市| 旅游| 九龙县| 滕州市| 阿巴嘎旗| 马公市| 罗平县| 柘城县| 武邑县| 个旧市| 凤台县| 和硕县|