OpenAI o3 / o4-mini 模型 AI 生成文本含特殊符號,推測為隱形水印快訊
導讀
Rumi 表示在 GPT-4o 等 OpenAI 此前模型中,推測這可能是 OpenAI 故意設置的水印,這種字符檢測方法誤報率極低。
IT之家 4 月 22 日消息,AI 初創公司 Rumi 發現 OpenAI 公司在 o3 和 o4-mini 模型中,嵌入了窄不換行空格(Narrow No-Break Space, NNBSP, U+202F)等特殊 Unicode 字符。
IT之家注:這些字符在普通視圖中與標準空格無異,但在 SoSciSurvey 或 Sublime Text 等專業工具中,可檢測其獨特代碼。
Rumi 表示在 GPT-4o 等 OpenAI 此前模型中,并不存在這些設置,這些選項可以通過簡單的“查找替換”移除,推測這可能是 OpenAI 故意設置的水印。
Rumi 強調,這種字符檢測方法誤報率極低,但易被繞過的缺陷明顯。另一種解釋是,這些字符符合排版規則,用于防止貨幣符號與金額或姓名縮寫間換行,可能是模型從訓練數據中習得的習慣。
OpenAI 此前曾探索過多種水印方案,例如在 2024 年初為 DALL?E 3 圖像添加 C2PA 元數據,以及 2025 年 4 月在 GPT-4o 模型上測試可見的“ImageGen”標簽。
行業內,谷歌的 SynthID、微軟的元數據嵌入和 Meta 的強制標簽也反映出對內容溯源的重視,但研究顯示許多水印技術易受攻擊。
1.TMT觀察網遵循行業規范,任何轉載的稿件都會明確標注作者和來源;
2.TMT觀察網的原創文章,請轉載時務必注明文章作者和"來源:TMT觀察網",不尊重原創的行為TMT觀察網或將追究責任;
3.作者投稿可能會經TMT觀察網編輯修改或補充。