白皮書

B+陷阱：人工智慧如何壓縮創意光譜

RLHF訓練的人工智慧系統會系統性地因產出符合人類平均偏好的輸出而獲得獎勵——這在數學上將其推向創造性平庸。本文定義了B+陷阱，將RLHF識別為結構性機制，並提出基於新穎性搜尋、對抗性分歧代理與元認知反饋的叛逆人工智慧框架。

DOI：

10.13140/RG.2.2.10486.46403

可於

作者：

這是 div 區塊中的一些文字。

出版物標題