2025年6月6日,第七屆智源大會在北京召開,智源研究院正式發(fā)布了“悟界”系列大模型,聚焦多模態(tài)、腦科學、具身智能與微觀生命分子建模四大核心方向。智源研究院王仲遠關(guān)于大模型與AGI發(fā)展的觀點,揭示了當前技術(shù)發(fā)展的關(guān)鍵階段與挑戰(zhàn),以下從技術(shù)邏輯與產(chǎn)業(yè)視角進行結(jié)構(gòu)化分析:
一、核心觀點解析
-
大模型通向物理AGI的技術(shù)轉(zhuǎn)折點
-
物理世界建模突破:當前大模型已從純符號推理轉(zhuǎn)向物理規(guī)律建模(如流體力學、材料特性預測),表明其開始理解物理世界底層規(guī)則。
-
多模態(tài)感知融合:視覺-語言-傳感器數(shù)據(jù)的聯(lián)合訓練(如具身視覺導航模型)正構(gòu)建跨模態(tài)世界模型,這是物理AGI的基礎(chǔ)設(shè)施。
-
仿真引擎協(xié)同進化:NVIDIA Isaac Sim等物理引擎與LLMs結(jié)合,通過數(shù)字孿生提供萬億次試錯訓練環(huán)境。
-
具身智能處于"前GPT-3時代"
-
數(shù)據(jù)匱乏瓶頸:機器人真實交互數(shù)據(jù)量(如UC Berkeley的DEC數(shù)據(jù)集僅10萬條)相比GPT-3訓練數(shù)據(jù)差5個數(shù)量級。
-
動作泛化難題:當前機器人策略模型在unseen場景的零樣本遷移成功率普遍<30%(MIT《Science Robotics》2024)。
-
成本約束:單臺具身智能設(shè)備(如Figure 01)硬件成本超25萬美元,限制規(guī);瘮(shù)據(jù)收集。
二、技術(shù)突破路徑
-
物理AGI關(guān)鍵使能技術(shù)
-
神經(jīng)微分方程:MIT團隊使用神經(jīng)常微分方程構(gòu)建可微物理模擬器,使LLMs能通過梯度下降優(yōu)化物理參數(shù)。
-
材料知識圖譜:DeepMind構(gòu)建包含2.8萬種材料特性的AtomGraph,為大模型提供結(jié)構(gòu)化物理知識。
-
因果推理模塊:Meta在LLMs中植入因果發(fā)現(xiàn)算法,在機器人任務中使因果推理準確率提升47%。
-
具身智能發(fā)展路線圖
-
仿真優(yōu)先策略:Google RT-X項目顯示,在仿真環(huán)境中預訓練可使真實世界操作成功率提升3.2倍。
-
跨形態(tài)知識遷移:斯坦!禫irtual to Real》研究表明,無人機訓練數(shù)據(jù)可通過特征解耦遷移至機械臂控制。
-
低成本數(shù)據(jù)采集:UC Berkeley開源的OP3機器人平臺將單臺成本壓縮至5萬美元級。
三、產(chǎn)業(yè)落地時間窗預測
技術(shù)方向 |
實驗室突破期 |
工業(yè)應用期 |
成熟期 |
物理模擬AGI |
2023-2025 |
2026-2028 |
2029+ |
消費級具身智能 |
2025-2027 |
2028-2030 |
2031+ |
工業(yè)級具身智能 |
2024-2026 |
2027-2029 |
2030+ |
數(shù)據(jù)來源:麥肯錫《AI物理系統(tǒng)發(fā)展報告2024》
四、待攻克挑戰(zhàn)
-
物理常識表征:當前大模型對"玻璃脆性"等基礎(chǔ)物理屬性的理解準確率僅61%(艾倫研究所測評)。
-
能量效率瓶頸:具身智能設(shè)備每決策耗能超200W,遠超生物大腦(約20W)。
-
安全驗證體系:缺乏適用于物理AGI的形式化驗證方法,現(xiàn)有測試覆蓋率不足40%。
五、戰(zhàn)略建議
-
建立物理常識基準測試:建議參考智源"悟道"大模型評測體系,構(gòu)建涵蓋力學/熱學/電磁學的標準化測試集。
-
開發(fā)仿真-現(xiàn)實數(shù)據(jù)橋接:重點投資NeRF+物理引擎的混合仿真技術(shù),降低真實數(shù)據(jù)依賴。
-
布局神經(jīng)符號系統(tǒng):融合LLMs與符號推理(如Wolfram Alpha引擎),提升物理規(guī)律演繹能力。
當前技術(shù)拐點要求學術(shù)界與產(chǎn)業(yè)界在物理建模方法、低成本機器人平臺、能耗優(yōu)化三個維度形成攻關(guān)合力,方能在2030年前實現(xiàn)物理AGI的關(guān)鍵突破。未來 3 年內(nèi),突破性的規(guī)模化應用最可能首先出現(xiàn)在特定、相對封閉的場景,尤其有大量重復、枯燥甚至危險的任務,非常適合具身智能第一波切入。 |