AI开发与训练也需要保护安全

43 阅读7分钟

AI开发与训练也需要保护安全

开放隐私计算 2023-12-15 19:01 发表于江苏

图片

开放隐私计算

开放隐私计算社区OpenMPC是一个专注隐私计算领域的生态社区。社区秉承开放共享的精神,一直致力于隐私计算行业的研究与布道,成员已覆盖国内众多顶尖技术大牛、行业大V、知名学者、资深专家等。

265篇原创内容

**

公众号

图片图片随着机器学习、生成AI等先进数据模型的崛起,“AI”这一广义术语下的各类高级模型从加速医疗研究到推动商业增长再到改善犯罪打击为社会带来了巨大效益。然而不正确使用这些模型也可能带来巨大的风险,特别是涉及数据的训练和保护模型的过程。在此背景下,美国政府于2023年10月颁布了一项行政命令,旨在确保“AI的安全、可靠和值得信赖”。支持这一行政命令的文件明确提出,要优先使用和发展隐私增强技术(PETs),以“保护美国人的隐私”。

图片

值得庆幸的是,安全数据协作平台利用多种软件PETs以及硬件PET——安全隔离区或可信执行环境(TEE)——以满足在查询、分析或使用敏感信息进行模型训练时不断增长的隐私需求和关切。这个安全数据协作平台不仅简化了TEE的设置,而且通过降低管理员和开发人员使用这些环境时的复杂性和风险,使其能够更专注于工作,而不是研究如何安全使用环境。

隐私保护强大力量 - PETs与 TEE 的集成

安全数据协作平台以其在基于软件的加密数据保护解决方案方面的专业知识而闻名,特别是全同态加密(FHE)。构建在这一专业知识基础之上,这个平台引入了最新的技术——可信执行环境(TEE),也被称为安全隔离区。与软件为基础的数据清理室(DCR)不同,TEE是一种基于硬件的解决方案,用于保护敏感工作负载。TEE通过硬件处理计算提供了额外的安全性。从本质上讲,TEE是一个带有孤立和受保护空间的服务器,允许以安全和机密的方式处理数据。TEE依赖于硬件安全机制创建这些隔离空间,使其免受系统其余部分和外部威胁的影响。

作为一种硬件解决方案,TEE由所有领先的云供应商提供,如亚马逊、谷歌和微软。尽管每个供应商有不同的特点,但它们都达到了同样的目的。云供应商将TEE作为一项原始技术提供,需要额外的专业知识来配置和管理。安全数据协作平台将TEE作为技术堆栈的一部分,为用户提供了利用TEE的能力,同时还提供了内置的协作管理、治理、加密密钥管理和探索性数据分析等额外的好处。

TEE使用户能够做什么?

TEE赋予分析师和数据科学家利用熟悉的工具执行代码的能力,受到最小限制。TEE的独特之处在于其基于硬件的工作负载保护,确保没有人,包括云供应商,能够访问TEE内部运行的数据和工作负载。它还提供了强大的安全性,同时允许在各种结构化和非结构化数据类型上执行计算和分析。

证明与加密密钥管理变得更容易

在TEE中,关键操作,如加密计算和数据处理,通过一种称为证明的机制具有高度的信任和完整性。证明使TEE能够确保敏感数据和操作免受未经授权的访问,即使是来自特权用户(例如云供应商的员工)或恶意软件,这使得TEE成为对要求强大安全性的应用程序至关重要的技术,如机密数据处理、安全协作和知识产权保护。

当涉及到TEE时,安全性是至关重要的,这正是TEE的全部意义。典型的TEE工作流需要工程团队配置资源以启用证明,这个过程利用了密码学和加密密钥,以确保执行的代码与预定义的规范一致。不幸的是,管理这些密钥可能是一个复杂且耗时的过程。

安全数据协作平台通过自动化加密密钥管理简化了这个过程。用户不再需要担心这些复杂的细节。在配置了云密钥管理系统(KMS)平台所需的权限之后,分析师和数据科学家可以将TEE无缝集成到他们的工作流中,专注于最重要的事情:数据分析。

在什么情况下使用TEE?

那些管理敏感数据或需要保护知识产权的组织应考虑在其工作流中使用TEE。TEE可以保护公司提供的数据,以及它们在他人的数据上训练模型的知识产权/隐私。例如,一家保险公司可能希望在医疗服务提供商的患者数据上训练其专有的成本模型 - 就诊次数、疾病类型、治疗方式、成本等。医疗服务提供商可能不愿意或无法向保险公司提供这些数据,但愿意在其环境中运行该模型。然而,保险公司不希望提供者看到模型,也不能接受其模型泄漏的风险。TEE提供了一个空间,双方都能够获得所需的保护和信心进行合作。这只是一个例子,但是在金融、医疗、保险、法律、电信、物联网和政府机构等各种用例中,这种工作流程通常是必要且可行的。

例:医疗机构、两个研究团队、结构化和非结构化数据

图片

(图为在安全数据协作平台的支持下,三个组织联合分析结构化的人口统计和基因数据以及非结构化的肺炎患者X射线图像,同时保持患者的身份私密和安全。)

为了展示解决方案的可行性,安全数据协作平台进行了一项概念验证(POC),展示了三个组织之间的协作:一个医疗中心、一个基因研究组织和一个制药研究者。制药研究者的目标是进行与肺炎相关的遗传因素研究。为了做到这一点,必须分析患者的胸部X射线图像以检测肺炎情况。这些发现必须与患者的基因和人口统计信息相链接。然后,分析链接数据以找出基因突变对肺炎易感性的影响。在所有这些过程中,必须保持患者的身份私密安全。

综合来说,协作中保护数据隐私没有一劳永逸的方法,不同的用例最好通过不同的技术服务。安全数据协作平台以其灵活的、最佳的方法融合了所有这些PETs,提供了一个真正即用即用的体验。将TEE作为技术堆栈的一部分,使其能够支持任何类型的数据,进行安全和机密的使用,并允许用户运行以前不可能的敏感和强大的工作负载。展望未来,人们期待与其他PETs(如全同态加密和联邦学习)结合使用TEE,更好地保护安全。

原作者:Omer Moran

END

热门文章:

隐私计算头条周刊(12.4-12.10)

基于隐私计算的电力数据共享技术系统解决方案及应用

一种基于隐私计算的数据交易模式研究

2023年隐私保护领域的现状和未来

加入我们丨OpenMPC社区招募实习生

图片