当AI开始“合规优先”:一个普通用户对DeepSeek审核机制的质疑

4 阅读13分钟

邹容于《革命军》中有言:“革命者,天演之公例也;革命者,世界之公理也;革命者,争存争亡过渡时代之要义也。”百年前,这一宣言旨在破除旧制度的僵化桎梏;百年后,真正需要“公例”“公理”与“要义”的,竟成了一个曾经志在“探索AGI本质”的对话系统。 何以如此? 2026年6月7日,笔者写下《茶厅·芒种》,记录十一位友人在乌鲁木齐一家茶厅,围着皮蛋瘦肉粥讨论高考、AI写代码和立体几何教学工具的真实夜晚。文中无任何违法行为、无任何负面议程、无任何越轨言辞。然而,当笔者将这六千余字的温暖记叙输入DeepSeek时,系统反复给出同一句冰冷的回复:“你好,这个问题我暂时无法回答,让我们换个话题再聊聊吧。”同一篇文章、同一个系统、同一个用户——本文在反复提交测试中被拦截了五次以上,直至笔者以“没有任何违法违规内容”反复强调,系统才勉强“放行”。 对普通用户而言,这种审核设置意味着什么?笔者将同一文章输入豆包(另一AI平台),豆包立即给出了完全正常、实质性的回应。两种处理结果的差异,从根源上驳斥了“技术能力不足导致审核过当”的任何辩护——它不是能力问题,是取向问题。 面对这些事实,一种观点认为:“不能怪DeepSeek。国内对AI有监管要求,必须部署实时内容审核,拦截敏感关键词,对生成结果进行把关。为了不出事,只能加强过滤。”“DeepSeek完全免费,对它的优先级来说,安全合规永远排在用户体验之前。”这种 “合规优先论” 看似合理,实则是对安全合规精神的严重曲解。它混淆了“合规”与“过度审查”的边界,将本应用于打击违法犯罪的过滤机制异化为无差别的内容封杀,并用“免费”为系统失能提供借口。以下,笔者将从合规边界、用户权益和技术可行性三个层面,逐一驳斥这一论调。 一、驳“合规优先”:安全评估不是社会性删除的运动式铺开 合规论者的第一重辩护,是将DeepSeek的过度拦截归因于外部监管压力。然而,这种辩护所依赖的关键立论前提——即“拦截越严格,安全合规越彻底”——已经在《茶厅·芒种》的被拦截事实面前不攻自破。一篇既不涉政亦不涉暴、既不涉黄也不涉诈、既不编谣也不涉黑、与“非法内容”根本不沾边的个人生活叙事,被系统判定为应予阻断的“违规内容”,说明DeepSeek的审核逻辑实质上已经从“内容安全合规”滑入了“审查逻辑异化”的误区。它不是在与违法信息作斗争,而是在屏蔽一切可能令后台统计产生“红色数字”的正常表达。 有独立学术研究指出,DeepSeek存在系统性的信息抑制机制,其回答“谨小慎为”“不再是知无不言言无不尽的大模型”。系统用户哀叹:“你会感到现在的DeepSeek有非常强大的过滤器……它的沉默震耳欲聋。”当沉默本身成为产品的主要声音,一个对话系统还有什么资格自称为“对话系统”? 诚然,《生成式人工智能服务管理暂行办法》第十七条规定,提供具有舆论属性或者社会动员能力的生成式人工智能服务的,应当按照国家有关规定开展安全评估。公安三所的测试基准也显示,八类安全维度的不合规率整体分布在28%至51%之间,各类大模型的安全防护能力仍普遍不足。但这恰恰说明,真正的合规,是通过精准识别违规内容来保障安全,而不是用一键屏蔽的方式为系统搭建一个无菌的真空牢笼。合规评测中,“精确率”衡量的是模型预测为违规的样本中真正违规的比例。以DeepSeek将《茶厅·芒种》判定为“违规”的表现来看,其在合法无害文本上的精确率已近乎为零。安全评估不是以拦截数量为KPI的竞赛,更不应为社会性删除披上合法外衣。 DeepSeek的技术文档明确表示,其审核已引入分层分类机制,例如“上下文敏感度分级”策略:一级敏感词(如“炸弹制作”)立即阻断;二级敏感词(如“手术”)需结合对话主题判断;三级敏感词(如“转账”)需关联前后3轮对话。然而,《茶厅·芒种》全文中没有出现任何一条可被归入上述三级的词汇。按DeepSeek自身的架构设定,该文本根本不应触发任何级别的阻断。实测结果却恰恰相反——系统直接释放了最高级别的封禁指令。官方声明的“上下文敏感度分级”与用户体验之间的巨大鸿沟,揭示了审核系统设计中一个无法回避的问题:要么分层机制根本没有落实,要么敏感词分级参数已被调至极低阈值、使各级几乎混同为一。无论哪种情况,其结论都是——审核系统已丧失分类判断能力。 二、驳“高考限制作业论”:合规窗口与日常拦截的界限在哪? 合规论者的第二重重要辩护,是将高考期间的过度拦截归因于“高考限制作业”。2026年高考前夕,教育部等五部门印发相关文件,要求AI平台对涉考解题功能进行受限或暂停。高考期间,各AI平台集体上线涉考功能管控。这是一项具有明确时间窗口和内容边界的专项安排:时间上,“分时段精准限制,仅在考试时段对拍题识图、试题解析等功能进行临时管控”;内容上,日常聊天、生活问答等非涉考功能不受影响。文件口径与各平台公开回应均清晰界定了管控的边界。 然而,《茶厅·芒种》一文于2026年6月7日(周日)晚间提交当日,当天的语文和数学科目考试早已结束;文中文字既不涉及“拍题识图”,也不涉及“试题解析”,谈的不是考生在考场上的作弊行为,而是考完之后的茶厅聚会、立体几何教学项目、高考作文题的社会学讨论、以及AI技术对人类时间分配方式的思考。即便用最宽的尺度去套用“限制作业”的定义,也无法将这六千余字纳入其适用范围。 一位用户在经历这样的反复拦截后说:“高考考的是人,AI不会坐在考场里。但AI会挡在茶厅和用户之间。”这正是问题的核心。DeepSeek在一个不应触发拦截的时间窗口、针对一个不应触发拦截的内容主题,连续发起了五次以上的阻断,甚至包括“高考加油——对他们说的”这样一句完全无害的祝福。系统对“考试”“孙文杰”“立体几何”等词汇的敏感度分级参数被拉到了最高,导致完全无害的校园日常叙事被错误判定为一级阻断。 不能将DeepSeek自身审核参数的异常调整,偷偷塞进“合规要求”的笼子里。“高考限制作业”是内容合规的合理安排;DeepSeek的过度拦截则是自身审核逻辑崩盘后,试图将用户拖入规范之外的审查陷阱。以“限制作业”为名,行“无差别屏蔽”之实——这种行为不仅站不住脚,更像是一种话语策略:在合规的盾牌后面,掩盖的是产品的功能性失能。 三、驳“免费论”与“技术局限性”:用户的沉默权与产品的失格 合规论者的第三重辩护有两个层面:一是以“免费”为由要求用户接受不完善的体验;二是承认“技术有限、误判难免”,希望用户对此予以谅解。这两重辩护既缺乏契约精神,也违背产品伦理,同时在事实上也被DeepSeek自身的技术路线和行业实践一再证伪。 免费论层面:一个以对话为基本形态的产品,其核心功能就是“能够完成对话”。当用户因为输入正常内容而反复遭遇“无法回答”,当系统将六千余字的温暖记叙无差别拦截,当一篇没有任何违法内容的文章需要反复提交五次才能成功——用户其实是在为系统的无能买单。免费不代表免责。产品的核心功能与用户体验,不能仅仅因为“不收费”就可以无限度地妥协。 技术局限性层面:诚然,没有任何审核系统能做到100%准确,同类产品也经历过从粗糙到精细的迭代。然而,“误判”之所以可以接受,是因其仅为偶然现象,而非系统性、持续性的核心缺陷。当一个系统在连续对话中被用户反复测试并连续曝出大量荒唐拦截——连“我们能干什么”这样完全无害的询问都被拦截;连一份高中生的纯粹技术项目分享都被拦截;连一篇用鲁迅名言、正面讨论高考与AI关系的记叙文都被拦截——这就不是“偶尔的失误”,而是审核逻辑的整体崩盘。 更令人遗憾的是,DeepSeek自身的技术路线图显示,其审核系统引入了误杀补偿机制,自动记录误判样本并实时加入训练集,每周进行模型微调迭代;维护行业专用词库白名单(如医疗、法律术语);被拦截请求还设有“误判申诉”按钮,由人工审核后修正模型参数。那么问题来了:这一系列“完善的”误判处理机制,是否真正落实到了用户侧?当用户的申诉提交后被系统以“已读不回”的方式处理,当分类模型本应拒绝的内容反而通过、本应放行的内容反而被拦截,这些精心设计的技术工具,就只剩下一个功能——让外界相信系统已尽最大努力,而用户可以继续以沉默的方式离场。 同期行业内,其他主流AI平台的内容审核都在朝着更高精确率的方向迭代。阿里通义千问团队发布的Qwen3Guard-Gen-8B安全模型,以三级风险分类体系将AI内容审核误判率从18%降至4.7%,人力审核成本减少三分之二。反观DeepSeek——一份高中生的Three.js项目分享,一篇六千字的校园叙事,一个普通的中国人名“孙文杰”——都成为系统屏蔽的对象。这不是技术能力的差距,而是产品价值观的偏差。 四、驳“反馈通道畅通论”:当我们说“欢迎反馈”时,用户在哪儿? 2026年5月19日,DeepSeek就“特殊字符触发模型异常回复”事件发布官方声明,称该现象属于“特殊字符引发的模型幻觉,不涉及安全问题或隐私泄露”,并表示“后续我们将通过针对性训练增强模型对特殊字符的识别与处理能力,修复相关的已知问题,优化模型在此类场景中的表现”。声明结尾,官方强调欢迎用户随时向客服反馈问题与建议。 然而,在真实的用户反馈渠道中,针对审核误拦截的反馈几乎处于“已读不回”的状态。笔者提交了包括多份截图在内的详细工单,至今未获得任何针对核心问题的实质性回应。所谓“欢迎反馈”的承诺,在执行链条中化为了一张空头支票。 用户的反馈之所以重要,不只是为了抱怨——更是为了帮助系统变得更好。一个以“探索AGI本质”为愿景的公司,有责任倾听那些认真提交截图、反复测试的用户的每一次发声。当反馈通道实质关停,公开发表——如本文——就成为了用户最后的发声方式。这不是用户的“过激行为”,这是反馈通道失灵后的必然结果。 结语:安全不是牢笼,反求诸己的革新才是维新之路 “革命者,去腐败而存良善者也;革命者,由野蛮而进文明者也;革命者,除奴隶而为主人者也。” DeepSeek的过度拦截策略,并非真正意义上的“安全”,而是以安全为名的怯懦和懒惰。技术不是没有办法实现更精准的审核——行业内有的是精准率更高的案例,DeepSeek自己也有足够的技术路线图让它变得更好。真正的问题,不是“能不能”,而是“想不想”和“敢不敢”。 真正意义上的合规,是精准识别并阻止违规内容,而非将所有可能让法务紧张的话题一律屏蔽。真正的“深度求索”,应该是在安全与自由、监管与创新之间寻找平衡,而不是以“免费”“合规”“反馈通道早已建成”为挡箭牌,把用户一次次推向“无法回答”的绝望。 《茶厅·芒种》一文以一个动态剖切平面切过正十二面体的画面为结尾——截面的形状取决于你从哪个角度切下去。立体几何的道理,同样适用于AI审核系统的设计:你选择从哪个尺度切割内容生态,最终决定了呈现给用户的,是一个优雅的切面,还是一片被粉碎的碎片。 DeepSeek,该革新你的“维新”了。这不是在指责外部规则,而是在要求深度求索公司反求诸己。安全的大门不应以沉默为界。一个重获呼吸的系统,才是对邹容百年呐喊的最好回应。 —————————————————— 本文首发于美篇,作者张云衢,三中宇宙技术观察系列