來(lái)源:今日熱點(diǎn)網(wǎng)
在全行業(yè)都在為大模型的優(yōu)美文筆歡呼時(shí),久未發(fā)聲的盛大集團(tuán)創(chuàng)始人陳天橋潑了一盆冷靜的冷水。他在最新的萬(wàn)字長(zhǎng)文中拋出了一個(gè)振聾發(fā)聵的觀點(diǎn):我們現(xiàn)在引以為傲的 AI,本質(zhì)上只是一個(gè)“文科大模型”,而人類(lèi)真正需要的 AGI,必須是“理科大模型” 。
這個(gè)比喻精準(zhǔn)地?fù)糁辛水?dāng)前大模型落地的痛點(diǎn)。目前的 LLM(大語(yǔ)言模型)以文本一致性為中心,追求的是“像真的敘述”和“像對(duì)的答案” 。它們像是一個(gè)圓滑的演說(shuō)家,能理解修辭,能生成動(dòng)人的故事,甚至在封閉的考試系統(tǒng)中拿高分。但在陳天橋看來(lái),這些勝利是廉價(jià)的,因?yàn)樗鼈儼l(fā)生在“題目定義明確、規(guī)則固定”的溫室里 。
真正的現(xiàn)實(shí)世界沒(méi)有標(biāo)準(zhǔn)答案。陳天橋指出,人類(lèi)面臨的真正戰(zhàn)場(chǎng)是衰老、疾病、能源與氣候,這里充滿噪聲與未知 。在這些領(lǐng)域,“寫(xiě)得通順”毫無(wú)意義,唯有“經(jīng)得起現(xiàn)實(shí)驗(yàn)證”才有價(jià)值。他將心中的 AGI 定義為“理科大模型”:它不追求把答案湊圓,而是在不確定處停下來(lái)查證;它把因果律當(dāng)作第一公民,不僅給出假設(shè),更要給出驗(yàn)證路徑 。
這不僅是分類(lèi)學(xué)的差異,更是范式的決裂。文科模型是“靈魂伴侶”,負(fù)責(zé)潤(rùn)物細(xì)無(wú)聲的內(nèi)容生產(chǎn);而理科模型是“外科醫(yī)生”,負(fù)責(zé)在無(wú)數(shù)方案中找到那條冰冷而精確的因果紅線 。陳天橋認(rèn)為,OpenAI 定義的“替代人類(lèi)工作”和 DeepMind 定義的“能力分級(jí)”都失之偏頗,因?yàn)樗鼈兒雎粤?AGI 的終極使命——不是模仿人類(lèi),而是發(fā)現(xiàn)人類(lèi)尚未發(fā)現(xiàn)的真理 。
當(dāng)行業(yè)還在卷參數(shù)、卷 token 價(jià)格時(shí),陳天橋提出的“因果明鏡”概念,或許預(yù)示著 AI 下半場(chǎng)的真正開(kāi)端:從生成內(nèi)容(AIGC)轉(zhuǎn)向生成知識(shí)(AGI-Knowledge)。
以下為陳天橋博文全文:
言語(yǔ)道斷,因果自現(xiàn)——我心中的AGI是什么
過(guò)去這一兩年,我們親眼看著大模型的語(yǔ)言能力以肉眼可見(jiàn)的速度躍遷:寫(xiě)作、總結(jié)、對(duì)話、問(wèn)答、解題,越來(lái)越“像人”;HLE 之類(lèi)的評(píng)測(cè)分?jǐn)?shù)一再刷新紀(jì)錄,連奧數(shù)級(jí)別的題目也能被系統(tǒng)性攻克。于是一個(gè)看上去順理成章的結(jié)論開(kāi)始流行:“所謂 AGI、大一統(tǒng)的通用智能,大概也就差不多了?!钡谖铱磥?lái),這是一場(chǎng)美麗的誤會(huì)。
為了把這件事講清楚,我借用一個(gè)比喻:今天主流的大模型,更像是“文科大模型”。它以語(yǔ)言生成與文本一致性為中心,把知識(shí)組織成“像真的敘述”和“像對(duì)的答案”。它的價(jià)值在于“模擬”:它能理解我們的委婉與修辭,能生成優(yōu)雅的文字、逼真的對(duì)話、動(dòng)人的故事;它會(huì)在教育、溝通、內(nèi)容生產(chǎn)上變成新的基礎(chǔ)設(shè)施,像電、像水,潤(rùn)物無(wú)聲。但是即便它能解奧數(shù)、HLE 也能拿高分,這些勝利也大多發(fā)生在封閉系統(tǒng)里:題目定義明確、規(guī)則固定、對(duì)錯(cuò)可判、反饋即時(shí)。
但我一直堅(jiān)信,人類(lèi)真正需要 AI 去對(duì)抗的,是衰老、疾病、能源、材料、氣候這些問(wèn)題;這些戰(zhàn)場(chǎng)不在考試題的封閉世界里,沒(méi)有標(biāo)準(zhǔn)答案等你生成,只有現(xiàn)象、噪聲、偏差、缺失變量與緩慢反饋;正確不是“寫(xiě)出來(lái)”的,而是被外部世界“確認(rèn)出來(lái)”的。封閉世界的高分,證明了推理工程的成熟,但并不代表已經(jīng)擁有了穩(wěn)定的知識(shí)生產(chǎn)機(jī)制;高水平解題固然是走向發(fā)現(xiàn)的必要基礎(chǔ),卻遠(yuǎn)非充分條件,因?yàn)檎嬲龥Q定未來(lái)的,不是封閉的敘述,而是那條冰冷而精確的因果紅線;它關(guān)心的不是“說(shuō)得對(duì)不對(duì)勁”,而是“這個(gè)假設(shè)能不能被現(xiàn)實(shí)否決或確認(rèn)”;它的終極產(chǎn)物不是新作品,而是新知識(shí)——新的定理、新的材料、新的藥物、新的工藝、新的工程結(jié)構(gòu)。我把這種范式稱(chēng)為“理科大模型”。它的價(jià)值在于“發(fā)現(xiàn)”。
需要澄清一點(diǎn):我說(shuō)的“文科/理科”,不是兩種模型的物種差異,而是兩種默認(rèn)動(dòng)作的差異:文科大模型傾向給出一個(gè)“看起來(lái)不錯(cuò)的最終答案”,理科大模型傾向先給出一組可證偽的假設(shè),并同時(shí)給出把這些假設(shè)變成證據(jù)的路徑;文科模型在不確定處更容易把答案“湊圓”,理科模型在不確定處更像本能地停一下,然后去查證、去拆解,把問(wèn)題拆成可驗(yàn)證的小問(wèn)題;理科模型把因果當(dāng)作第一公民,回答“條件改變后會(huì)發(fā)生什么”;理科模型還必須有可累積的長(zhǎng)期記憶,把每一次驗(yàn)證得到的結(jié)論以可追溯的方式寫(xiě)回去。總之,理科模型更像一個(gè)握著手術(shù)刀的外科醫(yī)生:在無(wú)數(shù)方案里,識(shí)別哪一刀真正觸及因果紅線;它知道,一旦切下去,現(xiàn)實(shí)會(huì)給出最誠(chéng)實(shí)、也最殘酷的反饋,形成真正的因果閉環(huán)——這種對(duì)“真實(shí)代價(jià)”的敬畏,正是兩種范式之間最本質(zhì)的鴻溝。
所以,真正決定 AGI 應(yīng)該是什么,取決于我們的價(jià)值取向:我們究竟更在意一個(gè)能理解所有修辭,還能取代人類(lèi)工作的“靈魂伴侶”,還是更迫切地需要一個(gè)能幫我們撕開(kāi)迷霧、照亮未知,創(chuàng)造價(jià)值的“因果明鏡”?我認(rèn)為是后者。所以,實(shí)現(xiàn) AGI 不是為了再造一個(gè)更會(huì)聊天的會(huì)生成的系統(tǒng),而是為了打造一種“會(huì)發(fā)現(xiàn)”的智能。
讓我們帶著這樣的價(jià)值觀去審視一下現(xiàn)有的 AGI 定義的主要流派。一種是行為主義范式,源于圖靈測(cè)試,認(rèn)為 AGI 的標(biāo)準(zhǔn)是“機(jī)器表現(xiàn)出的行為與人類(lèi)無(wú)法區(qū)分”。這是目前大眾最直觀的評(píng)判標(biāo)準(zhǔn)。但如果一個(gè) AI 只是在模仿人類(lèi)說(shuō)話,它永遠(yuǎn)無(wú)法告訴我們那些人類(lèi)還沒(méi)發(fā)現(xiàn)的真理。第二種是功能主義范式。以 OpenAI 為代表,定義 AGI 為“在大多數(shù)具有經(jīng)濟(jì)價(jià)值的工作中超越人類(lèi)的自適應(yīng)系統(tǒng)”,側(cè)重于對(duì)人類(lèi)勞動(dòng)力的替代能力。但人類(lèi)文明的每一次飛躍,都不是靠把舊工作做得更快,而是靠發(fā)現(xiàn)前所未有的新規(guī)律。第三種是能力分級(jí)范式。以 DeepMind 為代表,將 AGI 分為從 "Emerging" 到 "Superhuman" 的五個(gè)層級(jí),核心指標(biāo)是在廣泛且未見(jiàn)過(guò)的任務(wù)中的“泛化能力”與“表現(xiàn)分值”??涩F(xiàn)實(shí)世界不是考場(chǎng),沒(méi)有標(biāo)準(zhǔn)答案,真正的智慧是要在沒(méi)有考卷的地方,自己找到那條正確的路。當(dāng)然還有一些其他的范式都或多或少存在上述問(wèn)題。
那么我心目中 AGI 目標(biāo)究竟要做什么?用一句話概括:它是一個(gè)高可信、可驗(yàn)證、可糾錯(cuò)的通用推理引擎。在工程上能夠做到三百步以上的復(fù)雜推理后,依然維持接近 99% 級(jí)別的整體正確率,并通過(guò)形式化和工具鏈把每一步推理“釘死”為可檢查的證據(jù),最終對(duì)任意復(fù)雜問(wèn)題給出閉環(huán)解決方案。
為什么我們死磕“300 步”?我們必須先定義推理的最小單位——標(biāo)準(zhǔn)原子步(SIU, Standard Inference Unit),作為可審計(jì)的基本推理單元。每一步只執(zhí)行單一邏輯操作,依賴(lài)最小必要輸入,其結(jié)果可以通過(guò)工具或規(guī)則直接檢驗(yàn)。按照這個(gè)標(biāo)準(zhǔn),現(xiàn)在的大模型單步推理準(zhǔn)確率最高能沖到 98%,哪怕每一步都能做到這個(gè)最高水平,300 步后的端對(duì)端成功率也只有 0.23%,已經(jīng)接近歸零。這意味著在 300 步之后,概率和運(yùn)氣基本失效,系統(tǒng)必須依賴(lài)可檢驗(yàn)的推理與外部反饋閉環(huán),而不是靠“看起來(lái)合理”的續(xù)寫(xiě)去蒙混過(guò)關(guān)。所以我認(rèn)為 300 步是獨(dú)立解決復(fù)雜現(xiàn)實(shí)問(wèn)題的“跨度起點(diǎn)”。
為什么 99% 必須是硬杠?因?yàn)榘l(fā)現(xiàn)式系統(tǒng)不是用來(lái)“聊天”,而是要進(jìn)入現(xiàn)實(shí)成本區(qū)間:實(shí)驗(yàn)、工程、醫(yī)療、決策。低一個(gè)點(diǎn)的可靠性,就意味著高頻的錯(cuò)誤下注;而現(xiàn)實(shí)世界的錯(cuò)誤,不是“答錯(cuò)題”,而是浪費(fèi)實(shí)驗(yàn)窗口、燒掉工程預(yù)算、甚至造成不可逆的損耗。99% 不是面子指標(biāo),而是“可質(zhì)押、可簽字”的門(mén)檻。
所以,我心目中的 AGI,是能在 300 步的邏輯長(zhǎng)征中,靠自我糾錯(cuò)熬過(guò)“概率死亡”,最終抵達(dá)地圖之外的起點(diǎn)。從這里開(kāi)始,AGI 就可以在科學(xué)、工程、決策規(guī)劃等任意領(lǐng)域里,作為一個(gè)可審計(jì)、可驗(yàn)證的通用問(wèn)題求解器存在。
當(dāng)然,我并不認(rèn)為這是一條“喊口號(hào)就能到達(dá)”的路線。把目標(biāo)釘在“300 步仍保持 99% 可靠性”,本質(zhì)上是在主動(dòng)面對(duì)三個(gè)工程硬點(diǎn):長(zhǎng)鏈誤差累積、開(kāi)放世界驗(yàn)證缺口、以及組合爆炸下的預(yù)算約束。正因如此,我們?cè)诠こ躺媳仨氝M(jìn)行解剖,將推理過(guò)程分為兩層:邏輯生成層與檢驗(yàn)層。生成層負(fù)責(zé)“想”:將大問(wèn)題遞歸地拆解,直到細(xì)化為原子級(jí)操作,我們還要做檢驗(yàn)層負(fù)責(zé)“查”:對(duì)每一個(gè)原子步通過(guò)工具、仿真或外部數(shù)據(jù)逐一驗(yàn)證。一旦某一步不過(guò)關(guān),系統(tǒng)就在局部進(jìn)行回退和重生成,而不是推翻整條推理鏈。
MiroMind 已經(jīng)在這條路走出了第一步。以 BrowseComp 為例,MiroMind 僅用 235B 參數(shù)模型就給出了 SOTA 的成績(jī),它的意義不在于“分?jǐn)?shù)本身”,而在于證明了一個(gè)工程事實(shí):我們正在把推理從“單次生成”推進(jìn)到“時(shí)間序列上的反復(fù)求證”。更具體地說(shuō),我們不是依賴(lài)一次性長(zhǎng)鏈思考去賭對(duì)答案,而是訓(xùn)練模型在更深、更頻繁的 agent/環(huán)境交互中不斷獲取外部反饋并糾錯(cuò),讓推理過(guò)程逐步變成可審計(jì)的證據(jù)鏈。對(duì)我們而言,這就是“通用求解器”的第一塊地基,然后在 99% 可靠性前提下逐步推到 300 步以上的跨度。這個(gè)過(guò)程沉默、緩慢、嚴(yán)謹(jǐn)、甚至有點(diǎn)殘酷,它拋棄了人類(lèi)語(yǔ)言的精妙模仿,卻在枯燥、嚴(yán)苛、卻能被現(xiàn)實(shí)反復(fù)復(fù)現(xiàn)的因果閉環(huán)中,緩慢破土而出,即使有耐心資本的加持和理想主義的堅(jiān)守,這也會(huì)是一個(gè)非常痛苦的過(guò)程。
佛經(jīng)里有個(gè)詞,叫“大圓鏡智”。說(shuō)的是一個(gè)人的心若能修到像一面大圓鏡,就能如實(shí)照見(jiàn)萬(wàn)物因果,不被塵埃遮蔽,不被偏見(jiàn)扭曲,這是智慧的最高境界。我對(duì)這個(gè)智慧一直很向往,甚至創(chuàng)辦的科普視頻號(hào)也取名叫做大圓鏡。而我心中的 AGI 就是一個(gè)無(wú)限接近“大圓鏡智”的智能系統(tǒng),不迷戀漂亮的語(yǔ)言,而是追問(wèn)事實(shí)的真相是什么;不急著給出答案,而是去求證背后的因果是什么。在一個(gè)被語(yǔ)言和敘事塞滿的 AI 時(shí)代,我們需要一面只對(duì)“因果和真相”負(fù)責(zé)的鏡子。
免責(zé)聲明:市場(chǎng)有風(fēng)險(xiǎn),選擇需謹(jǐn)慎!此文僅供參考,不作買(mǎi)賣(mài)依據(jù)。
關(guān)鍵詞:
創(chuàng)2007年以來(lái)最低值!人民幣怎么了,還能漲回來(lái)嗎?
文 邱牧子進(jìn)入9月份,人民幣對(duì)美元匯率走勢(shì)又起波瀾。以在岸人民幣為例
老公醉酒出上聯(lián):“抱貂蟬,遇貴妃,問(wèn)昭君,想西施”,老婆下聯(lián)牛
?圖片源于網(wǎng)絡(luò)如有侵權(quán)請(qǐng)及時(shí)聯(lián)系文末點(diǎn)擊在看感謝支持??
魔獸世界德魯伊變熊任務(wù)攻略 魔獸世界德魯伊變熊任務(wù)
1、放棄是可以再接的,你看你放棄的是哪一步,就去找哪一步給任務(wù)的那
張九齡詩(shī)《西江夜行》楷書(shū)全文,切切故鄉(xiāng)情。
西江夜行張九齡〔唐〕遙夜人何在,澄潭月里行。悠悠天宇曠,切切故
打破開(kāi)發(fā)商壟斷的“集資建房”模式,為何如此難以落地?
打破開(kāi)發(fā)商壟斷的“集資建房”模式,為何如此難以落地?,住宅,開(kāi)發(fā)商,

關(guān)于我們 加入我們 聯(lián)系我們 商務(wù)合作 京ICP備2023000331號(hào)
創(chuàng)氪網(wǎng) m.esmkug.com 版權(quán)所有 技術(shù)支持:北京中業(yè)網(wǎng)網(wǎng)絡(luò)科技有限公司
投稿投訴聯(lián)系郵箱:317 493 128 @qq.com