欣朵的日志

每次看见有人说能够识别出一段文字是不是AI生成的，我都忍不住想笑

最近央视连续两天报道，全国大学生正被一个叫"AIGC检测"的东西搞得焦头烂额。毕业论文写完了，查重过了，导师点头了，最后卡在一个数字上：AI率超标。 很多学校要求低于30%才能答辩，有的卡在15%。

这个东西有多荒诞？

有人把诸葛亮的《出师表》丢进去，AI率61.79%。王勃的《滕王阁序》，AI率超过50%。一位中国人民大学的副教授花了三年写的研究成果，检测显示82.54%为AI生成——一个教别人做学术的人，自己的学术成果被判定为"不是人写的"。

光是5月2号这一天，某个论文检测平台悄咪咪升级了算法，同一篇论文，AI率从4%直接飙到52%。小红书上骂声一片。

但我不是在笑受害者。

我笑的是那些宣称"能识别AI生成内容"的技术方案本身。因为我恰巧知道，这件事，从根上就不可能。

来，我们做一个小实验。

你去面包店买一个面包。拿回实验室，做全成分分析。你能测出它的含水量、筋度、发酵程度、糖油比例。你能知道这个面包的一切。但有一件事你永远不可能知道：它是手工揉的面，还是机器揉的面。

你当然可以猜。你可以说"机器揉的面团通常更均匀，气孔分布更规律"，所以你看到一个气孔特别规整的面包，就判断它是机器揉的。但问题是——一个做了三十年面包的老师傅，他揉出来的面团，气孔比机器还规整。你怎么判？

文字完全一样。

你把一段文字拿来做分析。你可以统计它的用词分布、句式复杂度、转折词频率、段落节奏。你可以知道这段文字的一切统计特征。但有一件事你永远不可能知道：它是人写的，还是AI写的。

因为文字不携带"生产方式"这一信息。 就像面包不携带"是谁揉的"。这不是技术不够好，是信息本身就不包含这个答案。

目前所有的AIGC检测技术，不管叫什么名字、用多复杂的模型，本质上都在做同一件事：在统计特征上"猜"。猜的依据是：AI生成的文字往往更规整、更流畅、用词更符合概率分布。所以困惑度低的就是AI写的，困惑度高的就是人写的。

这个逻辑有多脆弱呢？

小红书上随便搜一个"降AIGC提示词"，复制进去，AI写的文字立刻就能变成"人类风格"。 反过来，一个逻辑清晰、表达精准的人，只要他写的东西足够规整，就会被判定为AI。

你写得越好，越容易被判为AI。写得越烂，越安全。这个系统不是在检测AI，它是在惩罚写得好的人。

有人会说，那可以加个水印啊！让AI在生成的时候嵌入特定的标记，检测的时候识别水印就行了。

这个思路听起来靠谱。Google的SynthID就在做这件事。问题是——破坏水印的成本远远低于嵌入水印的成本。 你把AI写的东西丢给另一个AI做一次润色，水印就没了。翻译成英文再翻回来，水印也没了。甚至你只需要手动改掉几个词、调换几个句子，统计水印就被破坏了。

而你能让全世界的AI模型都乖乖嵌入水印吗？OpenAI嵌了，那开源社区的那些模型呢？阿里通义千问呢？Kimi呢？任何一个模型不嵌，整个体系就是漏的。

这根本不是技术安全性问题，这是一个根本性的对抗劣势：破坏方永远比建设方省力。

所以回到最初的问题：从技术上，有没有真正有效的AI检测方案？

答案很清楚。

如果你说的"有效"是指只靠分析最终文字就做出准确判断——没有，且永远不会有。 这在信息论层面就不可能。文字不携带生产方式的信息，就像面包不携带揉面师傅的手温，河水不携带云层的海拔。

如果你说的"有效"是换个思路，比如追踪写作过程——有方向，但面对的是隐私和推行成本的问题，不是技术问题。

说清楚这件事之后，你再看那套"AIGC检测系统"，就会发现一个更有意思的问题：

一个连全球最顶尖的AI公司也无法解决的问题，为什么却能被一个与AI毫无关系的公司轻松解决？

想想那个五一假期的操作。5月2号，毕业季论文定稿最关键的时候，某平台悄悄升级了检测算法。没有预告，没有过渡期。学生五一回来一查，同一篇论文，AI率从4%直接跳到52%。答辩截止日就在眼前，你没有时间申诉，你甚至没有时间去问"你凭什么说我写的不是人写的"。

你只能再交一次钱，重新测。

测完不通过？改一改，再测，再交钱。还不通过？去小红书上找人"降AIGC"，30到50一篇，号称能把88%的AI率降到10%以下。交完这笔钱，再回去测，再交一次检测费。直到那个数字降到学校门槛以下。

看出这个所谓的"AIGC检测"生意真正是在做什么了吗？

这门生意的本质，不是要测的准，而是要能让你反复测。

准确了反而不好——准确了一次过，谁还测第二次？不测第二次，平台赚什么？

你想象一条河。河上没有别的桥，只有一座。桥是谁修的？我修的。桥安不安全？我说了算。检测标准是什么？商业机密。你想过河，必须从我这里过。过桥费十块。走到一半我说——桥不太稳，加固一下，再交五块。加固完了再走半截——又不太稳，再加固。你问我桥到底稳不稳？我说，你看，检测报告说你已经安全了。你问检测标准是什么？我说，这属于我们的核心算法。

为了能让你们 “平安” 过桥，让修桥的人真是操碎了心。

这也是为什么，每次看见有人一脸严肃地说"我们的AIGC检测系统能准确识别AI生成内容"，我都忍不住想笑。

笑完了，再仔细一看，后面排队交钱的人反而更多了。

如果觉得内容不错，欢迎你点一下「在看」，或是将文章分享给其他有需要的人^^

相关好文推荐：

一种快速判别产品AI含量的黄金指标，帮你远离披着AI外皮的传统软件公司

飞书会取代微信吗？

AI 时代的软件与软件公司应该长什么样？

引入嵌套学习（Nested Learning）：一种用于持续学习的全新机器学习范式

如何构建多智能体研究系统