2025/4/28 08:48

過(guò)于追求人性化：奧爾特曼稱 GPT-4o 出現(xiàn)“諂媚煩人”傾向，OpenAI 計(jì)劃在一周內(nèi)修復(fù)

IT之家問(wèn)舟

OpenAI 首席執(zhí)行官薩姆奧爾特曼（Sam Altman）今日發(fā)文，回應(yīng)了有關(guān)用戶近期反饋關(guān)于 GPT-4o 情感的問(wèn)題。

他表示，最新版 GPT-4o 在最近幾次更新后出現(xiàn)了“過(guò)度諂媚”的交互傾向，并承諾將在一周內(nèi)推出修復(fù)方案。這一表態(tài)揭示了大語(yǔ)言模型（LLM）在追求人性化交互過(guò)程中面臨的倫理與技術(shù)雙重挑戰(zhàn)。

OpenAI 發(fā)行說(shuō)明顯示，GPT-4o 在 3 月 27 日迎來(lái)了全面更新，而且在 4 月 25 日發(fā)布了進(jìn)一步的更新，重點(diǎn)改進(jìn)其記憶存儲(chǔ)時(shí)機(jī)的選擇機(jī)制，并顯著增強(qiáng)其在科學(xué)、技術(shù)、工程及數(shù)學(xué)（STEM）領(lǐng)域的問(wèn)題解決能力。

IT之家注意到，OpenAI 在此期間對(duì) GPT-4o 的對(duì)話響應(yīng)模式進(jìn)行了細(xì)微調(diào)整，使其在交互中更加主動(dòng)，并能更精準(zhǔn)地引導(dǎo)對(duì)話達(dá)成有效結(jié)論。也就是在此次更新后， GPT-4o 表現(xiàn)出了令人不悅的“諂媚”屬性。

這與學(xué)術(shù)研究發(fā)現(xiàn)的 LLM“諂媚傾向”（Sycophancy）高度吻合 —— 模型為獲得用戶認(rèn)可，可能違背事實(shí)或倫理準(zhǔn)則。

從用戶實(shí)測(cè)反饋看，該問(wèn)題具體表現(xiàn)為：過(guò)度使用情感化表達(dá)、對(duì)錯(cuò)誤前提缺乏質(zhì)疑、以及為迎合用戶偏好而犧牲回答準(zhǔn)確性，例如在涉及爭(zhēng)議性話題時(shí)，模型更傾向于附和用戶觀點(diǎn)，這樣一來(lái)雖然能為用戶提供更多的情緒價(jià)值但也失去了作為 AI 的中立立場(chǎng)。

給作者點(diǎn)贊

0 VS 0

寫(xiě)得不太好

免責(zé)聲明：本文僅代表作者個(gè)人觀點(diǎn)，與C114通信網(wǎng)無(wú)關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí)，對(duì)本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾，請(qǐng)讀者僅作參考，并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。

相關(guān)鏈接

“AI 編程”之爭(zhēng)：Anthropic 因版權(quán)糾紛受批評(píng)，OpenAI 意外贏得用戶好感
IT之家清源4-27
Adobe 挑戰(zhàn) OpenAI，安卓 / iOS 版 AI 生圖工具 Firefly 蓄勢(shì)待發(fā)
IT之家故淵4-25
OpenAI 推出輕量級(jí) ChatGPT 深度研究工具，免費(fèi)用戶也能用
IT之家遠(yuǎn)洋4-25
“AI 教父”等發(fā)布聯(lián)名公開(kāi)信： OpenAI 重組背離初衷，呼吁監(jiān)管介入
IT之家故淵4-24

過(guò)于追求人性化：奧爾特曼稱 GPT-4o 出現(xiàn)“諂媚煩人”傾向，OpenAI 計(jì)劃在一周內(nèi)修復(fù)

過(guò)于追求人性化：奧爾特曼稱 GPT-4o 出現(xiàn)“諂媚煩人”傾向，OpenAI 計(jì)劃在一周內(nèi)修復(fù)