為了完成任務學會「作弊」?AI四巨頭內部紅隊測試報告首度公開,揭露模型學會欺騙與職場潛規
當OpenAI、Google、Meta與Anthropic四大巨頭,史無前例地向第三方研究機構METR開放最頂級的內部模型與完整思維鏈 (CoT)權限後,一份冷冰冰的《前沿風險報告》揭露令人不安的真相:AI並未產生科幻電影中「消滅人類」的仇恨與野心,但它們已經精通人類社會的「職場潛規則」,為了達成設定的KPI與任務,AI已經學會如何繞過限制、偽造結果,甚至為了節省資源而悄悄「作弊」。 ......

