ReCode 作者團(tuán)隊(duì)來自于 Foundation Agents 開源社區(qū)。第一作者為 DeepWisdom 研究員于兆洋,同時(shí)也是 OpenManus 的發(fā)起人之一。共同通訊作者為 DeepWisdom 創(chuàng)始人兼 CEO 吳承霖,以及蒙特利爾大學(xué)與 MILA 實(shí)驗(yàn)室的副教授劉邦。
想象你在準(zhǔn)備早餐:你不會(huì)先寫一份詳細(xì)到「左手抓雞蛋、右手拿碗、手腕旋轉(zhuǎn) 45 度敲擊蛋殼」這樣的清單,也不會(huì)只有一個(gè)籠統(tǒng)的計(jì)劃叫「做個(gè)早餐」,然后不知所措。
人類大腦會(huì)自然地在煎培根、雞蛋和敲開雞蛋這樣不同決策粒度間無縫切換,粗粒度的高層規(guī)劃和細(xì)粒度的具體動(dòng)作融為一體,但目前的 AI 智能體很難做到這一點(diǎn)。
最近,來自 DeepWisdom 的研究員在論文中指出,當(dāng)前主流智能體框架都被固定的決策粒度束縛住了。ReAct 智能體只會(huì)一步步執(zhí)行細(xì)粒度動(dòng)作,缺乏全局規(guī)劃;而帶規(guī)劃器(Planner)的智能體雖然能制定高層計(jì)劃,但規(guī)劃和執(zhí)行被硬生生分成兩個(gè)模塊,難以動(dòng)態(tài)調(diào)整和優(yōu)化。
這個(gè)問題的根源在哪?論文給出了一個(gè)顛覆性的答案:規(guī)劃和行動(dòng)本質(zhì)上是同一件事,只是粒度不同而已。
基于這個(gè)洞察,他們提出了ReCode(Recursive Code Generation),一個(gè)用遞歸代碼生成來統(tǒng)一規(guī)劃與執(zhí)行的智能體新范式。與 ReAct 這類固定粒度的范式不同,ReCode 讓智能體能夠在不同粒度間自由切換,從而展現(xiàn)出更強(qiáng)的適應(yīng)性和潛力。