微軟報告稱 GPT-4 易受“越獄”提示詞影響 生成不良內(nèi)容
時間:2023-10-18 11:43:41
- 來源:IT之家
- 作者:3DM整理
- 編輯:方形的圓
IT之家今日(10月18日)消息,微軟旗下研究團隊近日發(fā)表論文,詳細研究了大型語言模型 (LLM) 的“可信度”和潛在毒性,特別關(guān)注 OpenAI 的 GPT-4 及其前代 GPT-3.5。
研究團隊,GPT-4 雖然在標準基準測試中比 GPT-3.5 更加可靠,但容易受到“越獄”提示(繞過模型安全措施)影響。GPT-4 可能會根據(jù)這些“越獄”提示,生成有害內(nèi)容。
論文中強調(diào) GPT-4 更容易受到惡意“越獄”系統(tǒng)或用戶提示影響,會準確地遵循(誤導性)指令,生成不良內(nèi)容,微軟強調(diào)這個潛在漏洞不會影響當前面向客戶的服務。

玩家點評 (0人參與,0條評論)
熱門評論
全部評論