【太平洋科技快讯】近日,相关消息透露,OpenAI的o3和o4-mini模型生成的文本中,含有特殊的Unicode字符,如窄不换行空格(NNBSP, U+202F)。这些字符在普通情况下难以察觉,但在专业工具下却无所遁形。消息源表示,这可能是OpenAI设置的隐形水印,用于追踪AI生成内容。
消息源在分析OpenAI的o3和o4-mini模型时,注意到生成的文本中夹杂着一些特殊的Unicode字符。这些字符,如窄不换行空格(NNBSP, U+202F),在普通文本视图中与标准空格并无二致,但在SoSciSurvey或Sublime Text等专业工具中,可以检测到其独特的代码。
关于这些特殊字符的用途,存在两种可能的解释。一种解释是,OpenAI有意将这些字符作为隐形水印嵌入到文本中。OpenAI此前曾探索过多种水印方案,例如在2024年初为DALL·E 3图像添加C2PA元数据,以及2025年4月在GPT-4o模型上测试可见的“ImageGen”标签。
另一种解释是,这些特殊字符并非用于水印,而是模型从训练数据中习得的一种排版习惯。窄不换行空格通常用于防止文本在特定位置换行,例如货币符号与金额之间,以提高文本排版的美观性和可读性。
消息源指出,通过特殊字符检测AI生成内容的方法,虽然误报率极低,但存在易被绕过的缺陷。用户可以通过简单的查找替换操作移除这些特殊字符。此外,这种方法的准确性也可能受到质疑,因为特殊字符的出现并非完全由AI模型控制,也可能是模型从训练数据中习得的结果。
尽管存在技术局限性,但AI生成内容的溯源与版权保护仍然是行业内的重要议题。谷歌的SynthID、微软的元数据嵌入和Meta的强制标签等,都反映出各大公司对内容溯源的重视。然而,研究显示许多水印技术易受攻击,如何在技术实现与伦理规范之间找到平衡,仍是行业面临的一大挑战。
丁丁打折网©版权所有,未经许可严禁复制或镜像 ICP证: 湘ICP备20009233号-2
Powered by 丁丁打折网本站为非营利性网站,本站内容均来自网络转载或网友提供,如有侵权或夸大不实请及时联系我们删除!本站不承担任何争议和法律责任!
技术支持:丁丁网 dddazhe@hotmail.com & 2010-2020 All
rights reserved