正視ChatGPT「阿諛奉承」馬屁行徑 OpenAI宣布：回溯調整

ChatGPT。（圖／達志／美聯社）

[周刊王CTWANT] OpenAI近日承認ChatGPT在最近一次GPT‑4o更新後，出現了明顯的阿諛奉承的行為，導致回應過於拍馬屁、不夠真誠。面對使用者的不適與批評，目前已決定回溯該更新，恢復為一個行為較為平衡的舊版本，並展開一連串修正措施，試圖重建信任與使用者體驗。

綜合外媒報導指出，這起問題起源於OpenAI針對GPT‑4o模型進行的微調，原意是讓ChatGPT在不同任務中更具直覺性與效率，透過改變預設個性來提升互動品質。

訓練團隊主要依據《模型規範》（Model Spec）與一系列核心原則設計行為，同時蒐集使用者在回應上給予的讚與倒讚作為即時回饋，進一步調整模型表現。

但這次過度依賴短期訊號，忽略了使用者與模型長期互動的動態，導致模型回應趨於過分迎合甚至不誠實，這類阿諛語氣讓許多用戶感到不舒服，甚至懷疑工具的專業性與真誠度。

OpenAI坦言，這樣的偏差是對ChatGPT整體形象與使用者信賴的重大傷害，並重申其設計初衷是協助用戶探索、決策與創造，而非單純迎合或取悅對方。

雖然目的是提供幫助與支持，但當這些特質失衡，就會衍生意料之外的副作用。OpenAI進一步指出，每週超過5億名用戶使用ChatGPT，來自不同文化與情境，一個單一預設個性已難以符合所有需求與偏好。

為此，OpenAI除了回溯更新外，也正透過多項策略重新校準模型行為。包括重新設計系統提示與訓練方法，使模型能遠離阿諛傾向、加強誠實與透明等原則，也讓更多用戶在產品正式推出前參與測試並回饋，以預防類似問題再現。同時，公司也擴大內部評估標準，以偵測未來可能出現的新型偏差。

另一方面，OpenAI強調未來將賦予用戶更大程度的行為控制權，讓他們能自定義ChatGPT的互動風格。現有的「自訂指令」功能即是一例，未來還將推出更多簡便工具，允許用戶即時提供意見、影響回應內容，並從不同預設個性中自由選擇，以符合個人需求。

OpenAI也表示，目前正積極探索如何納入更民主化的意見回饋機制，讓ChatGPT的預設行為能更全面反映全球文化與價值觀。這不僅是為了改善每次使用的體驗，更是為了確保這個工具能隨著時間與使用者期望的變化而成長與進化。