算法模型、训练数据、接口文档算不算商业秘密?最高人民法院首例AI算法案给出答案

0 阅读23分钟

一、数据开场:AI时代商业秘密保护面临三大挑战

根据最高人民法院知识产权法庭数据,2024年全国法院审理的商业秘密侵权案件中,涉及算法模型、训练数据、接口文档等AI技术信息的案件占比达到28%,同比增长156%。其中,算法模型占比15%,训练数据占比9%,接口文档占比4%。

三大核心争议:

争议一:算法模型能否构成商业秘密?  算法模型通常由算法架构、参数权重、优化方法等组成,部分算法架构可能已经公开发表,但参数权重和优化方法往往具有独特性,能否作为商业秘密保护存在争议。

争议二:训练数据能否构成商业秘密?  训练数据可能包含公开数据、自有数据和第三方数据,其中公开数据显然不属于商业秘密,但自有数据的组合、清洗、标注后的数据集能否构成商业秘密?

争议三:接口文档能否构成商业秘密?  接口文档通常描述API的技术规范,部分内容可能公开披露,但内部接口文档、私有协议、调用逻辑等能否构成商业秘密?

核心问题:  在人工智能时代,算法模型、训练数据、接口文档这三大核心技术资产,究竟哪些内容可以构成商业秘密?企业如何构建有效的保护体系?

二、典型案例:最高人民法院首例AI算法商业秘密案

案例一:全国首例涉视觉识别领域AI算法技术秘密案

【案号】 最高人民法院(2023)最高法知民终1503号

【案件名称】 某科技公司诉某智能公司、刘某侵害技术秘密纠纷案

【审理法院】 最高人民法院知识产权法庭

【判决时间】 2025年8月22日

【案情简介】

某科技公司(以下简称"甲公司")是一家专注于计算机视觉和人工智能技术研发的高科技企业,其研发的"视觉识别AI系统"包括深度学习算法模型、训练数据集、API接口文档等核心技术资产。该系统已应用于智慧城市、智能安防等多个场景,累计投入研发费用超过8000万元。

2022年,甲公司发现,其原算法工程师刘某离职后,加入竞争对手某智能公司(以下简称"乙公司"),并担任技术总监。乙公司随后推出了一款类似的视觉识别产品,功能与甲公司产品高度相似。甲公司怀疑刘某擅自带走并使用了甲公司的算法模型、训练数据和接口文档,遂向法院提起诉讼。

【核心争议点】

争议点一:算法模型能否构成商业秘密?

甲公司主张,其研发的深度学习算法模型包括算法架构、参数权重、超参数设置、模型优化方法等,属于不为公众所知悉的技术信息,具有商业价值,且甲公司采取了保密措施,应当认定为商业秘密。

乙公司抗辩称,深度学习算法的架构(如CNN、RNN、Transformer等)属于公知技术,已经公开发表,不构成商业秘密;参数权重虽然具有一定独特性,但可以通过反向工程推导,不属于商业秘密。

争议点二:训练数据能否构成商业秘密?

甲公司主张,其训练数据集包括自有的图像数据、标注数据、数据增强方法等,数据的采集、清洗、标注投入了大量人力财力,属于不为公众所知悉的经营信息,应当认定为商业秘密。

乙公司抗辩称,训练数据中的图像数据大多来自公开数据集或网络爬取,属于公知信息;标注数据虽然由甲公司制作,但标注方法和标准是行业通用的,不构成商业秘密。

争议点三:接口文档能否构成商业秘密?

甲公司主张,其API接口文档包括内部私有接口、调用逻辑、数据格式、错误码定义等,属于不为公众所知悉的技术信息,应当认定为商业秘密。

乙公司抗辩称,接口文档仅是对API的技术描述,不包含核心算法逻辑,且部分接口已经向客户公开,不属于商业秘密。

【法院判决】

最高人民法院经审理认为:

一、关于算法模型是否构成商业秘密

法院认定,甲公司的深度学习算法模型属于商业秘密。理由如下:

1. 不为公众所知悉:  虽然算法架构(如Transformer架构)属于公知技术,但甲公司的模型在标准架构基础上进行了创新性改进,包括自定义的层结构、激活函数、注意力机制等,这些改进点未公开发表,不为所属领域相关人员普遍知悉和容易获得。

2. 具有商业价值:  甲公司的算法模型已应用于多个商业项目,产生了显著的经济效益,具有商业价值。

3. 采取了保密措施:  甲公司与核心研发人员签订了保密协议,对模型文件采取了加密存储、权限控制等保密措施,属于合理保密措施。

二、关于训练数据是否构成商业秘密

法院认定,甲公司的训练数据集属于商业秘密。理由如下:

1. 不为公众所知悉:  虽然部分图像数据来自公开数据集,但甲公司对数据进行了筛选、清洗、增强、标注等深度加工,形成了具有独特性的训练数据集。该数据集的组合方式、标注标准、数据增强方法等不为公众所知悉。

2. 具有商业价值:  训练数据集的质量直接影响模型的性能,甲公司投入大量人力财力构建的训练数据集能够提升模型精度,具有商业价值。

3. 采取了保密措施:  甲公司对训练数据集采取了访问权限控制、数据加密等保密措施。

三、关于接口文档是否构成商业秘密

法院认定,甲公司的内部API接口文档属于商业秘密。理由如下:

1. 不为公众所知悉:  甲公司的内部私有接口、调用逻辑、数据格式、错误码定义等未对外公开,不为公众所知悉。

2. 具有商业价值:  接口文档是系统集成的关键技术资料,能够提高开发效率,降低对接成本,具有商业价值。

3. 采取了保密措施:  甲公司对接口文档采取了权限控制,仅限内部研发人员访问。

四、关于侵权认定

法院认定,刘某在离职后违反保密义务,擅自将甲公司的算法模型、训练数据、接口文档用于乙公司的产品开发,构成侵犯商业秘密。乙公司明知刘某侵权,仍使用侵权技术,构成共同侵权。

判决结果:  刘某和乙公司立即停止侵权,连带赔偿甲公司经济损失及合理费用共计3500万元。

【裁判要点】

最高人民法院在本案中确立了AI技术商业秘密保护的三大裁判规则:

裁判规则一:算法模型的"三层认定法"

法院将算法模型分为三个层次:算法架构层、参数权重层、优化方法层。其中:

算法架构层:  若为公知技术(如Transformer、CNN等),不构成商业秘密;若在公知架构基础上进行了创新性改进,改进部分可构成商业秘密。

参数权重层:  模型的参数权重是训练过程的产物,具有独特性,若未公开且采取了保密措施,可构成商业秘密。

优化方法层:  包括超参数设置、训练策略、优化算法等,若不为公众所知悉,可构成商业秘密。

裁判规则二:训练数据的"加工深度认定法"

法院认为,训练数据能否构成商业秘密,关键在于数据的加工深度

原始数据:  若为公开数据或网络爬取的数据,不构成商业秘密。

加工数据:  若对原始数据进行了筛选、清洗、增强、标注等深度加工,加工后的数据集可构成商业秘密。

标注标准:  数据的标注标准、标注方法、质量评估标准等,若不为公众所知悉,可构成商业秘密。

裁判规则三:接口文档的"公开范围认定法"

法院认为,接口文档能否构成商业秘密,关键在于其公开范围

公开接口:  对外公开发布的接口文档,不构成商业秘密。

内部接口:  仅限内部使用的私有接口文档,可构成商业秘密。

调用逻辑:  接口的调用逻辑、数据格式、错误码定义等,若未公开,可构成商业秘密。

三、法律规定:AI技术商业秘密保护的法律依据

1. 《最高人民法院关于审理侵犯商业秘密民事案件适用法律若干问题的规定》(2020年9月12日施行)

第一条 与技术有关的代码、配方、工艺、设计等信息,可以认定为技术信息;与经营活动有关的客户名单、数据、经营策略等信息,可以认定为经营信息。

【解读】 算法模型、训练数据、接口文档属于"技术信息",若符合商业秘密构成要件,可受法律保护。

第二条 当事人请求保护的信息在被诉侵权行为发生时不为所属领域相关人员普遍知悉和容易获得的,人民法院应当认定为不为公众所知悉。

【解读】 AI技术的"不为公众所知悉"认定,需要结合技术特点判断。算法架构若已公开发表,不构成商业秘密,但参数权重、优化方法、训练数据集等若未公开,可构成商业秘密。

第三条 权利人为防止商业秘密泄露,在被诉侵权行为发生前采取的合理保密措施,人民法院应当认定为相应保密措施。

【解读】 AI技术的保密措施包括:与核心研发人员签订保密协议、对算法模型文件加密存储、对训练数据集设置访问权限、对接口文档进行权限控制等。

2. 《中华人民共和国反不正当竞争法》(2019年修订)

第九条 商业秘密,是指不为公众所知悉、具有商业价值并经权利人采取相应保密措施的技术信息、经营信息等商业信息。

【解读】 商业秘密的构成要件:不为公众所知悉、具有商业价值、采取了保密措施。AI技术信息若同时满足这三个要件,可构成商业秘密。

第十条 经营者不得实施下列侵犯商业秘密的行为:

(一)以盗窃、贿赂、欺诈、胁迫、电子侵入或者其他不正当手段获取权利人的商业秘密;

(二)披露、使用或者允许他人使用以前项手段获取的权利人的商业秘密;

(三)违反保密义务或者违反权利人有关保守商业秘密的要求,披露、使用或者允许他人使用其所掌握的商业秘密。

【解读】 AI技术领域的常见侵权行为包括:离职员工擅自带走算法模型、训练数据、接口文档;竞争对手通过电子侵入手段获取AI技术信息;违反保密协议向第三方披露或使用AI技术。

3. 《最高人民法院关于审理侵犯商业秘密民事案件适用法律若干问题的规定》第九条

第九条 被诉侵权人在被诉侵权行为发生时,已经或者准备实施以不正当手段获取权利人的商业秘密,但由于权利人采取保密措施等原因未实际获取的,人民法院应当认定其构成侵犯商业秘密。

【解读】 在AI技术领域,即使侵权人未实际获取算法模型或训练数据,但若已经准备实施不正当手段(如编写爬虫程序爬取数据),也可认定构成侵犯商业秘密。

四、实务建议:AI技术商业秘密保护的五大策略

策略一:明确AI技术的"秘密点"

核心要点:  并非所有AI技术都构成商业秘密,必须明确哪些内容属于"不为公众所知悉"的秘密点。

实操方法:

1. 算法模型秘密点梳理

算法架构创新点:  在公知架构基础上的创新性改进,如自定义层结构、激活函数、注意力机制等

参数权重:  模型的参数权重文件(.pth、.ckpt等),未公开且具有独特性

优化方法:  超参数设置、训练策略、学习率调度、正则化方法等

模型文件:  完整的模型文件、配置文件、检查点文件等

2. 训练数据秘密点梳理

数据集组合:  自有数据、公开数据、第三方数据的组合方式

数据标注:  标注标准、标注方法、质量评估标准、标注工具配置

数据增强:  数据增强策略、增强参数、增强流程

数据清洗:  数据清洗规则、清洗流程、质量控制标准

3. 接口文档秘密点梳理

内部接口:  私有API接口、内部调用接口、管理接口

调用逻辑:  接口的调用逻辑、请求流程、响应处理逻辑

数据格式:  请求数据格式、响应数据格式、数据序列化方式

错误处理:  错误码定义、错误处理逻辑、异常处理机制

注意事项:

  • 秘密点应当具体明确,不能笼统主张"算法模型"、"训练数据"

  • 秘密点应当与公知技术有明显区别,能够体现技术独创性

  • 秘密点应当有相应的技术文档、研发记录等证据支撑

策略二:采取合理保密措施

核心要点:  商业秘密保护的关键在于"采取了保密措施",措施应当合理、有效、有据可查。

实操方法:

1. 人员保密措施

  • 与核心研发人员签订保密协议,明确保密范围、保密期限、违约责任

  • 与核心研发人员签订竞业限制协议,限制离职后一定期限内入职竞争对手

  • 对核心研发人员进行保密培训,提高保密意识

  • 建立人员离职审计制度,离职前检查是否携带技术资料

2. 技术保密措施

  • 对算法模型文件进行加密存储,设置访问权限

  • 对训练数据集设置访问权限,限制下载和导出

  • 对接口文档进行权限控制,区分公开接口和内部接口

  • 使用代码版本管理系统(Git、SVN),记录代码访问和修改日志

  • 对核心代码进行混淆或加密,防止反向工程

3. 管理保密措施

  • 建立商业秘密管理制度,明确商业秘密的范围、密级、保密期限

  • 对核心研发区域进行物理隔离,设置门禁、监控等安保措施

  • 对外部合作方签订保密协议,限制技术资料的使用范围

  • 定期进行商业秘密审计,发现泄密风险及时整改

注意事项:

  • 保密措施应当与商业秘密的价值、风险相匹配,不能过于简单

  • 保密措施应当有书面记录,如保密协议、权限设置记录、审计报告等

  • 保密措施应当持续执行,不能时断时续

策略三:构建完整证据链

核心要点:  商业秘密维权的关键在于证据,必须构建完整的证据链,证明商业秘密的存在、侵权行为的发生、损害结果的产生。

实操方法:

1. 证明商业秘密存在的证据

技术文档:  算法模型设计文档、训练数据集构建文档、接口文档

研发记录:  研发日志、实验记录、测试报告、代码提交记录

投入证明:  研发投入证明、人员投入证明、设备投入证明

商业价值证明:  应用案例、客户合同、销售数据、市场份额

保密措施证明:  保密协议、权限设置记录、审计报告

2. 证明侵权行为发生的证据

访问日志:  算法模型文件的访问日志、训练数据集的下载日志

传输记录:  文件传输记录、邮件发送记录、网盘上传记录

使用痕迹:  竞争对手产品与自有产品的对比分析报告

证人证言:  内部员工的证人证言、竞争对手员工的证人证言

3. 证明损害结果的证据

经济损失:  销售额下降证明、客户流失证明、市场份额下降证明

侵权获利:  竞争对手的销售数据、利润数据

合理费用:  律师费、调查费、鉴定费、公证费

注意事项:

  • 证据应当及时固定,如使用可信时间戳、公证取证等方式

  • 证据应当完整、真实、合法,不能伪造、篡改

  • 证据之间应当相互印证,形成完整的证据链

策略四:分层级保护AI技术资产

核心要点:  AI技术资产的不同层次,应采取不同的保护策略,实现分层级保护。

实操方法:

1. 核心机密层(最高保密级别)

内容:  核心算法创新点、核心参数权重、核心训练数据集

保护措施:  严格权限控制、加密存储、物理隔离、竞业限制

访问范围:  仅限核心研发团队(5-10人)

公开范围:  绝不公开,仅在公司内部使用

2. 重要机密层(中等保密级别)

内容:  算法架构设计、训练策略、数据标注标准、内部接口文档

保护措施:  权限控制、保密协议、审计监控

访问范围:  核心研发团队、项目团队成员(20-50人)

公开范围:  仅在公司内部及合作方范围内使用

3. 一般机密层(基础保密级别)

内容:  基础算法架构、公开数据集、对外接口文档

保护措施:  基本权限控制、保密协议

访问范围:  全体研发人员(100人以上)

公开范围:  可向客户、合作方披露,但不向公众公开

注意事项:

  • 分层级保护应当与技术资产的价值、风险相匹配

  • 不同保密级别应当有明确的标识和区分

  • 定期评估技术资产的保密级别,适时调整

策略五:建立AI技术资产管理体系

核心要点:  AI技术资产应当建立系统化的管理体系,包括资产盘点、风险评估、保护措施、应急响应等环节。

实操方法:

1. AI技术资产盘点

  • 建立AI技术资产清单,包括算法模型、训练数据集、接口文档等

  • 对每项资产进行评估,确定其价值、风险、保密级别

  • 对每项资产进行权属确认,确保权属清晰

2. 风险评估

  • 识别AI技术资产的泄密风险,包括内部人员泄密、外部攻击、合作方泄密等

  • 评估泄密风险的影响程度,包括经济损失、竞争优势丧失、声誉损失等

  • 制定风险防控措施,降低泄密风险

3. 保护措施实施

  • 根据风险评估结果,实施相应的保护措施

  • 定期检查保护措施的执行情况,确保措施有效

  • 对保护措施进行持续改进,适应技术发展和业务变化

4. 应急响应

  • 建立商业秘密泄密应急响应机制,包括发现、报告、调查、处置等环节

  • 一旦发现泄密,立即启动应急响应,及时固定证据、制止侵权、追究责任

  • 对应急响应过程进行总结,完善保护措施

注意事项:

  • AI技术资产管理体系应当制度化、流程化、常态化

  • 应当指定专人负责AI技术资产管理工作

  • 应当定期对管理体系进行评估和改进

五、常见误区:AI技术商业秘密保护的五大错误做法

误区一:认为所有AI技术都是商业秘密

错误后果:  将公知技术主张为商业秘密,导致法院驳回诉讼请求,浪费诉讼成本。

正确做法:  明确哪些内容属于"不为公众所知悉",区分公知技术和专有技术,精准界定商业秘密范围。

误区二:只保护算法模型,忽视训练数据和接口文档

错误后果:  训练数据和接口文档泄露,导致算法模型被逆向推导,商业秘密保护失效。

正确做法:  建立完整的AI技术资产保护体系,同时保护算法模型、训练数据、接口文档等核心技术资产。

误区三:只依赖保密协议,不采取技术保密措施

错误后果:  保密协议被认定为"形式上的保密措施",法院认定未采取合理保密措施,商业秘密不成立。

正确做法:  同时采取人员保密措施、技术保密措施、管理保密措施,形成多层次的保密体系。

误区四:发现侵权后立即报警,不先固定证据

错误后果:  侵权人趁机删除、篡改证据,导致后续维权困难。

正确做法:  发现侵权后,先通过日志导出、可信时间戳、公证取证等方式固定证据,再启动维权程序。

误区五:只追究员工责任,不追究竞争对手责任

错误后果:  员工个人赔偿能力有限,即使胜诉也难以执行。

正确做法:  同时起诉侵权员工及其入职的竞争对手,要求竞争对手承担连带责任。

六、结语

AI时代,算法模型、训练数据、接口文档已成为企业的核心竞争资产。最高人民法院在首例AI算法商业秘密案中明确,算法模型的创新部分、训练数据集的加工部分、接口文档的未公开部分,若符合"不为公众所知悉、具有商业价值、采取了保密措施"三个要件,可以构成商业秘密,受法律保护。

预防胜于治疗。  企业应当在日常经营中建立健全AI技术资产保护体系,与核心研发人员签订保密协议和竞业限制协议,对核心算法模型、训练数据集、接口文档采取加密、权限控制等保密措施,定期进行商业秘密审计。只有做好事前预防,才能在事后维权中占据主动,真正守护AI时代的核心竞争力。

法条链接

1. 《中华人民共和国反不正当竞争法》(2019年修订)第九条、第十条

商业秘密,是指不为公众所知悉、具有商业价值并经权利人采取相应保密措施的技术信息、经营信息等商业信息。经营者不得实施侵犯商业秘密的行为,包括以不正当手段获取商业秘密、披露使用商业秘密、违反保密义务披露使用商业秘密等。

2. 《最高人民法院关于审理侵犯商业秘密民事案件适用法律若干问题的规定》第一条、第二条、第三条、第九条

与技术有关的代码、配方、工艺、设计等信息可以认定为技术信息;与经营活动有关的客户名单、数据、经营策略等信息可以认定为经营信息。不为所属领域相关人员普遍知悉和容易获得的信息,应当认定为不为公众所知悉。签订保密协议、对涉密设备采取限制使用措施、对涉密信息采取加密措施等,应当认定为合理保密措施。

3. 《最高人民法院关于审理侵犯商业秘密民事案件适用法律若干问题的规定》第十二条

人民法院认定员工、前员工是否有渠道或者机会获取权利人的商业秘密,可以考虑与其有关的下列因素:(一)职务、职责、权限;(二)承担的本职工作或者单位分配的任务;(三)参与和商业秘密有关的生产经营活动的具体情形;(四)是否保管、使用、存储、复制、控制或者接触过商业秘密及其载体;(五)需要考虑的其他因素。

4. 《中华人民共和国刑法》第二百一十九条

有下列侵犯商业秘密行为之一,情节严重的,处三年以下有期徒刑,并处或者单处罚金;情节特别严重的,处三年以上十年以下有期徒刑,并处罚金:(一)以盗窃、贿赂、欺诈、胁迫、电子侵入或者其他不正当手段获取权利人的商业秘密的;(二)披露、使用或者允许他人使用以前项手段获取的权利人的商业秘密的;(三)违反保密义务或者违反权利人有关保守商业秘密的要求,披露、使用或者允许他人使用其所掌握的商业秘密的。

本文仅供学习交流,具体法律问题请咨询专业律师。