當AI不斷用自己生成的數(shù)據(jù)“喂養(yǎng)”自己,它就可能逐漸失去準確性,最終輸出越來越多錯誤信息,甚至“胡言亂語”。英國倫敦國王學院領(lǐng)導的研究團隊發(fā)現(xiàn),只需在訓練過程中加入哪怕一條來自真實世界的數(shù)據(jù),就可能有效阻止這種被稱為“模型崩塌”的現(xiàn)象。相關(guān)成果發(fā)表于新一期《物理評論快報》。
“模型崩塌”這一概念于2024年提出,指的是AI模型如果長期依賴自身生成的數(shù)據(jù)進行訓練,模型性能會不斷退化,最終輸出失真內(nèi)容。隨著高質(zhì)量人類文本數(shù)據(jù)逐漸接近枯竭,越來越多AI系統(tǒng)開始使用合成數(shù)據(jù)訓練,這讓模型崩塌風險進一步上升。
此次,團隊通過分析一類被稱為“指數(shù)族”的統(tǒng)計模型發(fā)現(xiàn),在封閉循環(huán)訓練(模型完全依賴自身生成數(shù)據(jù)學習)中,模型崩塌幾乎不可避免。
研究顯示,解決方法異常簡單:只需在訓練過程中加入一條來自外部世界的真實數(shù)據(jù),哪怕其數(shù)量遠遠少于AI生成數(shù)據(jù),也足以阻止模型性能持續(xù)退化,這種作用即使在機器生成數(shù)據(jù)數(shù)量無限增加時依然有效。
過去關(guān)于模型崩塌的研究多集中在大語言模型等復雜系統(tǒng),由于其內(nèi)部機制難以解釋,錯誤來源也難以追蹤,這也成為AI產(chǎn)生“幻覺”的原因之一。通過研究更簡單的統(tǒng)計模型,科學家能夠從數(shù)學上解釋為何少量真實數(shù)據(jù)就能打破模型崩塌,從而為未來更復雜AI系統(tǒng)提供設(shè)計原則。
類似現(xiàn)象也存在于另一類名為“受限玻爾茲曼機”的機器學習模型中,表明這一規(guī)律可能具有更廣泛適用性。下一步,他們計劃將這一理論擴展到神經(jīng)網(wǎng)絡(luò)等更復雜的系統(tǒng),以驗證其在大語言模型中的實際效果。
友情鏈接: 政府 高新園區(qū)合作媒體
Copyright 1999-2026 中國高新網(wǎng)chinahightech.com All Rights Reserved.京ICP備14033264號-5
電信與信息服務業(yè)務經(jīng)營許可證060344號主辦單位:《中國高新技術(shù)產(chǎn)業(yè)導報》社有限責任公司