隐私计算-SecretFlow/SCQL-如何在不泄漏隐私数据下进行联合数据分析隐私计算是一类技术的统称，旨在实现数据的

隐私计算是一类技术的统称，旨在实现数据的“可用不可见”，即在保护数据隐私的前提下完成计算任务。其核心目标是解决数据共享与隐私保护之间的矛盾，广泛应用于金融、医疗、政务等敏感数据场景。

隐语SecretFlow支持包括MPC、FL、TEE、HE、DP在内的多种主流隐私计算技术，以期通过良好的分层设计及开箱即用的隐私保护数据分析及机器学习等功能，降低开发者使用门槛。

安全协作查询语言（Secure Collaborative Query Language, SCQL）则是一个允许多个互不信任参与方在不泄露各自隐私数据的条件下进行联合数据分析的系统。

我的SCQL系列文章：

关键特点

半诚实安全。SCQL 假设所有参与方都是半诚实的。
支持多方（N>=2）。
支持常见的 SQL select 语法和函数，满足大多数场景的需求。详情请查看 SCQL 实现进度。
可实用的性能。SCQL 有多层次的性能优化。
易于使用。SCQL提供了类似于关系 SQL 的界面。
数据使用授权。SCQL 为数据所有者提供了一个名为 CCL（Column Control List, 列控制列表）的机制，以定义他们的数据使用限制。

架构

SCQL 系统支持中心化和 P2P 两种部署模式。中心化模式依赖于可信第三方，但部署和配置过程更简单；P2P 则不需要依赖额外的可信第三方。更多细节可查看隐私计算-SecretFlow/SCQL-SCQL的两种部署模式架构。

中心化模式——SCDB

中心化模式下的 SCQL 系统由一个 SCDB 服务器和多个 SCQLEngines 组成：

SCDB 服务器负责将 SQL 查询翻译成明密文混合执行图，并将执行图下发给参与方的 SCQLEngine。
SCQLEngine 是一个明密文混合执行引擎，它与参与方协作运行执行图并将查询结果报告给 SCDB 服务器。SCQLEngine 是在secretflow的 MPC 框架 secretflow/spu 的基础上实现的。

P2P模式——Broker

P2P 模式下的 SCQL 系统由 SCQLBrokers 和 SCQLEngines 组成，各方都有自己独立的 SCQLBroker 和 SCQLEngines：

SCQLBroker：作为 P2P 的核心模块，主要包含三个功能：用户交互：通过 http 接口接受请求并返回结果。 P2P 状态同步：完成不同 SCQLBroker 之间的状态同步。 SQL 分析及作业调度：将 SQL 查询转换为明密文混合的执行图，并调度到本地 SCQLEngine 执行。
SCQLEngine：SCQLEngine 是一个明密文混合执行引擎，不同参与方的 SCQLEngine 可以协作完成执行图计算，本地的 SCQLEngine 会将结果报告给 SCQLBroker 。

SCQL 如何工作

我们将通过以下的 SCQL 查询样本 Q 的整个生命周期来展示 SCQL 是如何工作的。

SELECT AVG(bank_1.deposit), AVG(bank_2.loan)
FROM bank_1
INNER JOIN bank_2
ON bank_1.customer_id = bank_2.customer_id;

表结构

bank_1 参与方 Bank1 在其本地数据库 DB1 中有张表 bank_1，该数据表有两列分别是 customer_id 和 deposit。
bank_2 参与方 Bank2 在其本地数据库 DB2 中有张表 bank_2，该数据表有两列分别是 customer_id 和 loan。

列控制列表（CCL）

CCL 格式: <src_column, dest_party, constraint>

它表示 src_column 可以被 dest_party 在满足 constraint 的条件下访问。

为了使查询 Q 通过 CCL 验证，数据所有者应该授予以下 CCL。

Bank1

  -   <bank_1.customer_id, Bank1, PLAINTEXT>
  -   <bank_1.deposit, Bank1, PLAINTEXT>
  -   <bank_1.customer_id, Bank2, PLAINTEXT_AFTER_JOIN>
  -   <bank_1.deposit, Bank2, PLAINTEXT_AFTER_AGGREGATE>

Bank2

  -   <bank_2.customer_id, Bank2, PLAINTEXT>
  -   <bank_2.loan, Bank2, PLAINTEXT>
  -   <bank_2.customer_id, Bank1, PLAINTEXT_AFTER_JOIN>
  -   <bank_2.loan, Bank1, PLAINTEXT_AFTER_AGGREGATE>