二、先把“名字”搞清楚:算法备案、大模型备案、登记
很多人把“算法备案”“大模型备案”“模型登记”当成一回事,其实不是。
打个比方你就明白了。你要开一家餐厅,需要同时去工商部门办营业执照(类似模型登记),去食药监部门办食品经营许可证(类似大模型备案),还要去消防部门做消防安全评估(类似算法备案)。三个部门、三套标准、三个流程,少了任何一个,餐厅都开不合法。
AI领域的这三个备案,也是同样的逻辑:
算法备案,管的是你用算法做什么。核心监管逻辑是:你的算法是怎么影响用户的?比如推荐算法会决定用户看到什么内容,搜索算法会决定什么信息被优先展示,这些都涉及信息分发和用户权益,需要备案。
大模型备案,管的是你的大模型本身。核心监管逻辑是:你的大模型安全不安全?会不会生成有害内容?训练数据从哪儿来?这些问题回答不好,大模型就不能对外提供服务。
模型登记,管的是大模型的基本信息。核心监管逻辑是:你的大模型是谁开发的、什么版本、对外提供什么能力?像给一辆车上牌照一样,登记了才能上路。
三个备案,管的维度不同,主管部门不同,要求不同,流程不同,我们一个个拆开说。
三、算法备案:不是所有产品都要做,但做了的企业都在后悔没早做
3.1 什么是算法备案
算法备案的全称是**“互联网信息服务算法推荐服务备案”**,依据的是2022年发布的《互联网信息服务算法推荐管理规定》。
简单来说,如果你用算法给用户做以下这些事情,就需要做算法备案:
-
推荐内容:比如今日头条的信息流推荐、抖音的视频推荐、电商平台的商品推荐
-
排序搜索:比如搜索引擎的结果排序、外卖平台的商家排名
-
生成合成:比如AI写作、AI换脸、AI配音这类AIGC功能
-
个性化推送:根据用户画像做精准营销、差异化定价(大数据杀熟)
监管的出发点是:算法可能会影响信息分发、左右用户决策、甚至涉及隐私和公平性,所以需要备案接受监管。
3.2 哪些产品必须做算法备案
这里有个常见的误区:很多人以为只有“算法公司”才需要做算法备案。
只要你产品里用了上述几类算法功能,就需要做。常见场景包括:
-
基于大模型的AI助手产品,如果有内容推荐或生成类功能
-
社区类产品:有信息流推荐、热门排序;电商平台,有商品推荐、搜索排序;内容平台,有创作者推荐、内容分发;客服类产品,如果用了对话生成或智能分配
一个自检的小方法:打开你的产品,问自己三个问题:我的用户看到的信息是我人工安排的吗?有没有算法在决定展示顺序?有没有根据用户特征做个性化处理?
如果答案都是“否”,那不需要算法备案。如果有,建议你找我们进行评估。
3.3 算法备案到底要准备什么材料
算法备案的材料清单比较长,主要包括:
算法主体的基本信息、算法推荐服务的主要功能说明、算法机理的简要说明、算法运行机制的技术文档、用户权益保护措施、安全评估报告、投诉举报渠道说明
材料清单本身不复杂,但难点在于:
第一,很多材料需要技术团队配合写,而且要写得“既专业又能让监管看懂”。很多企业自己写完提交,被打回来好几次,原因就是技术文档写得要么太深奥(看不懂),要么太浅(被认为敷衍)。
第二,安全评估报告有固定格式和评分标准,需要严格按照要求来做。我们见过太多企业自己做的安全评估报告,因为评分不达标被退回。
第三,备案信息需要定期更新,如果产品功能调整、算法变更,需要及时做变更备案。
四、大模型备案:管的是模型安不安全,不是你公司有没有AI
4.1 什么是大模型备案
大模型备案的全称是**“生成式人工智能服务备案”**,依据的是2023年发布的《生成式人工智能服务管理暂行办法》。
它的监管逻辑和算法备案完全不同:算法备案管的是“算法怎么用”,大模型备案管的是“大模型安不安全”。
如果你的产品对外提供大模型服务,说白了就是让用户可以调用你的AI能力(聊天、写作、生成图片等),就需要做大模型备案。
4.2 典型需要大模型备案的场景
-
你自研了大模型,对外提供API调用或直接服务
-
你基于开源大模型做了微调,对外提供服务
-
你的产品接入了第三方大模型,但在你的产品界面里直接呈现AI生成结果给用户(这种情况要看具体业务形态,有些需要备案,有些可能不需要)
一个关键区分点:如果你的产品只是调用了第三方大模型的API,然后把结果展示给用户,这算不算“大模型服务”?
这个问题在业内有争议,不同地区的监管尺度可能略有差异。但保守建议是:只要你的产品名称、对外宣传、功能呈现都和“大模型”“AI”强绑定,让用户感知到是AI在服务你,你最好提前确认是否需要备案。
4.3 大模型备案的材料清单
大模型备案的材料比算法备案更复杂,主要包括:
模型的基本信息、训练数据来源说明、语料标注规则、安全性评估报告、 服务协议和用户协议、内容过滤和审核机制说明、投诉举报和应急处置方案、违法内容处置记录等等
材料准备的难点在于:训练数据来源要说得清楚,很多人这一步就被卡住了——“我的数据是从公开网络爬的”“我的数据是买的”“我的数据是用户贡献的”……每种情况都有不同的合规要求,不是简单一句“数据合规”就能过的。
五、模型登记:名字听起来最简单,但坑也不少
5.1 什么是模型登记
模型登记是**“深度合成服务提供者”和“生成式人工智能服务提供者”**需要向网信部门做的信息登记。依据的是《互联网信息服务深度合成管理规定》和《生成式人工智能服务管理暂行办法》。
模型登记更像是给大模型办一个“身份证”:你是谁(提供者名称)、你叫什么(模型名称)、你长什么样(版本号和基本参数)、你有什么能力(服务类型)。
登记的目的是:监管手里有一份清单,知道现在市面上有哪些大模型在提供服务,一旦出问题可以追溯到具体责任主体。
5.2 模型登记和大模型备案是什么关系
这是另一个容易混淆的地方。
简单说:大模型备案是“安不安全”,模型登记是“是谁”。
两者的关系是:
-
独立关系:模型登记是独立的备案项,和大模型备案并行
-
实际中经常一起做:很多情况下,企业会同时准备两个备案的材料,一起提交
但注意:不是所有产品都需要同时做两个备案。有些产品只需要做模型登记,不需要大模型备案;有些产品两个都要做。后面讲“双备案”的时候会详细说。
5.3 模型登记需要准备什么
相比前两个备案,模型登记的材料清单短一些,主要包括:
- 服务提供者的基本信息、拟上线的深度合成/大模型服务的名称、形式、范围、模型基座的基本信息(如使用开源模型,需要说明)、服务规则和协议、 投诉举报渠道
六、“双备案”政策解读:两个同时做
当一个产品同时涉及算法推荐功能和大模型服务时,就需要同时做两个备案,这就是“双备案”。
比如:你的产品是一个AI聊天助手,用户可以问问题、AI来回答。这个回答的生成过程涉及大模型服务(需要大模型备案),同时你的产品还有“热门问题推荐”“相关问题引导”等功能(需要算法备案)。时候,你就需要做双备案。
再比如:你的产品是一个AI写作工具,用户输入关键词,AI生成文章。这个生成过程需要大模型备案,同时你的产品会根据用户历史行为推荐“写作模板”“素材库”,这就涉及算法推荐功能,需要算法备案。
一个判断标准:打开你的产品,如果用户能同时感受到“我在用AI服务”和“这个产品在给我推荐内容”,那你大概率需要双备案。
双备案的难度是单独备案的两倍吗
不是两倍,是指数级增加。原因很简单:双备案需要同时满足两个备案的所有要求。
材料要准备两套,流程要跑两条,对接的审核人员可能不同(虽然都是网信部门,但不同地区、不同业务线的审核标准可能有细微差异)。
更麻烦的是:两个备案的进度可能不同步。比如大模型备案先过了,算法备案被退回要求补充材料,这时候你的产品是上还是不上?
所以双备案的企业,建议一开始就找有经验的服务商统筹规划,避免各自为战、反复返工。
七、为什么你的材料总被退回?总结了100+退回案例后发现的问题
我们团队这几年经手了上百个备案案例,遇到过各种奇葩的退回理由。这里总结几个最高频的问题,看看你有没有中招:
7.1 “算法机理说明”写得让审核员看不懂
这是算法备案被退回的第一大原因,很多人觉得算法机理说明要写得越专业越好,结果审核员看完一头雾水。
正确的方式是:用非技术人员能理解的语言,把算法的核心逻辑说清楚。比如你做一个内容推荐算法,你要说的是“用户喜欢什么类型的文章,就给他推类似的文章”,而不是“在注意力机制下通过多层感知器计算用户与内容的匹配度”。
7.2 训练数据来源说不清楚
这是大模型备案被退回的第二大原因。很多企业的回答是:“数据是从公开渠道获取的”“数据是经过清洗的”“数据是合规的”。但审核员要的不是结论,是过程。
你需要说明:数据从哪里来、什么时候获取的、有没有涉及个人信息、怎么清洗的、清洗掉了什么、最终用了多少数据。
这些问题如果回答不上来,说明你的数据治理工作还没做到位,需要先补课。
7.3 安全评估报告格式不对
算法备案和大模型备案都要求提交安全评估报告,但两个报告的格式要求不同。
有些企业拿算法备案的模板套大模型备案,或者拿去年的模板套今年的最新要求,结果一提交就被退回。
建议:先去监管部门官网下载最新版的模板,对照着一条一条写。
7.4 备案类型选错了
这是最可惜的一种情况。
辛辛苦苦准备了半年,材料写了几百页,结果提交后被告知“您的产品不适用这个备案类型,请重新选择”。
比如有些企业的产品其实不需要算法备案,但自己以为需要,白忙一场;有些企业需要大模型备案但只做了算法备案,被要求补做。
避免方法:提交前,找有经验的人帮你过一遍材料,确认备案类型是否正确。