首页 手机兼职平台区块链正文

全面概述七类隐私计算技术:零常识证明、MPC 与同态加密等

admin 区块链 2020-11-24 18:30:45 6718 0

PlatONPlatON

便

今日,PlatON 立异研究院的夏博士为咱们解析隐私核算的各项技能。

全面概述七类隐私计算技术:零常识证明、MPC 与同态加密等

现在业界提出隐私核算的时间并不太久,学术界对它的清晰界说其实是源于 2016 年李凤华博士等人的一篇文章。可是其时的界说过于方式化,实践难以完结。现在隐私核算仍是由以数据为中心的大数据职业来驱动的(包含金融、医疗、政务、物流、互联网等职业在这个数据的隐私维护上有比较强的需求)。

其次,隐私核算也有合规的需求:现在欧盟的 GDPR 以及美国医疗方面的法规现已比较齐备了。国内大数据职业也不能像原先那样直接卖数据。比方说,两个企业之间需求数据同享,不能像原先那么简略粗犷以买卖的方式来做,它会形成个人数据的隐私走漏以及导致企业面对处分危险。比方,企业 a 和企业 b 之间做这个数据同享,企业 a 直接把数据明文丢给企业 b;假如 b 拿到 a 数据再去卖,那么 a 的数据价值的确丢掉了,一同伴有隐私走漏的危险。所以从这个层面来说, 数据明文同享或许数据明文买卖,以后会越来越少。

怎么用隐私核算的技能处理现有的数据同享或许数据协同的痛点?职业里边有一句俗话叫「 数据可用不行见 」。比方说,a 和 b 之间要去做一个联合模型练习,b 有自己的模型,然后需求用到 a 的一些数据来把这个模型建的愈加准确。数据本来是以明文的状况直接活动的,现在咱们需求将它处理成密态数据,即以暗码学的处理方式,使得整个建模进程中各方受到了隐私维护,b 无法逆推推出 a 的恣意原始数据片段,a 无法取得 b 的模型信息。 「可用」指的是 b 最终把 a 供给的这份数据的价值用到了;「不行见」的意思便是说明文在它的全生命周期中,除了在 a 的本地以外,其他地方都无法解析取得。

隐私核算从技能的分类来看,有以下几个首要方向:首要是以暗码学为中心的隐私核算技能栈,包含安全多方核算、零常识证明以及同态加密等,其次是联邦学习、可信履行环境以及差分隐私等技能。

全面概述七类隐私计算技术:零常识证明、MPC 与同态加密等

差分隐私

差分隐私是一种偏统计学的概念,最早在医疗职业有需求。它的意思是 我对一个数据库参加一些噪声进行扰动,加完噪声之后的数据库和和原始数据库比较,查询的准确性依然很高,一同新数据库被识别出隐私的概率被最大极限地下降。

差分隐私这个技能的运用场景相对比较有限。比方说当医院获取到一些患者的基因数据,但不期望任何人通过这些患者基因数据相关一些外部的数据库(比方患者在某个医院的医疗信息),识别到患者的身份。当相似于数据库之间需求做这种联立进犯的情况下,可以用差分隐私来维护。但这种技能不归于干流的隐私核算,由于它没有方法去做一些像联合建模或许数据交集核算这些常用的使命。

全面概述七类隐私计算技术:零常识证明、MPC 与同态加密等

TEE

浅显地说, TEE 是将一切的使命都丢到一个黑盒子里边去核算 。一般咱们会将核算的时分用到代码和数据放在操作体系层面。黑盒子是在操作体系里边的一个特别的可信履行环境。那这种可信履行环境使得你可以将触及灵敏数据的核算使命都丢到这个盒子里边。在可信履行环境里边跑的可信运用是无法和一般的运用做数据交互的。当它跟外部的数据作交互的时分,需求通过特别的一些安全接口,一同它的运行时安全也做得比较好。

现在,这个技能比较大的问题是它的安全性彻底树立在对 TEE 产品的信赖上。世界上 Global Platform 世界规范化安排最早做这块的规范。现在完结技能首要有英特尔的 SGX、AMD 的 SEV 和还有 ARM 的 Trust Zone 等。

隐私核算里边需求用到的使命,TEE 差不多都能跑起来,可是它会有一些局限性。由于它是一个硬件布置,所以硬件的晋级改造一般没有软件那么轻量级和便利。假如硬件出了一个缝隙的话,呈现的问题会比较大;以及 TEE 有时分无法处理一些对网络带宽和核算资源要去比较高的使命。TEE 的长处便是它的规划和架构布置相对比较简略。

全面概述七类隐私计算技术:零常识证明、MPC 与同态加密等

联邦学习

联邦学习(Federated Learning, FL)最早是由谷歌提出来的,他们其时要处理的一个问题:谷歌期望将每个人散布式手机上的数据汇总到一同,然后做一个模型的练习。所以谷歌一开始提出的联邦学习的开源结构是依据移动的环境下的。开展到现在,像微众银行、百度,包含谷歌自己,都提出了各自的联邦学习的技能结构。联邦学习其实首要处理的便是怎么样在一个散布式的环境下,各个参加方有各自的数据,怎么将这些数据充分运用起来进行模型练习,又能满意各个参加方的隐私诉求(参加方不期望把自己的数据告知剩下方,乃至是可信渠道)。

联邦学习的算法需求用到一些机器学习的模型建模的:比方说神经网络、逻辑回归或是线性回归。 联邦学习中,多个数据源在散布式的条件下,期望仅通过传递梯度来维护数据隐私和完结模型练习。 而且假定中心层的梯度值走漏出来不影响安全性,不会导致进犯者对原始数据的获取。

联邦学习它有许多长处,比方支撑比较多的 AI 算法,且功率比较高。联邦学习的缺陷在于这套技能是 AI 专家提出来的,它的安全性根底缺少理论支撑。现在业界也会对一些联邦学习的计划做进犯,而且依据梯度安全性的进犯,现已有一些效果出来了。

从详细的联邦学习分类来看,由于每一方的数据散布不同,其架构规划也是有差异的。一般分为横向联邦和纵向联邦,别离面向相同维度可是不同用户组,和不同维度可是相同用户组的建模场景。

全面概述七类隐私计算技术:零常识证明、MPC 与同态加密等

同态加密

同态加密是一种特别的加密技能。加密是怎么将明文进行改换,变成密文的一个进程。同态加密是什么意思呢?它的实质便是说我可以对密文做核算。密文自身它是一个无序、内容随机散布的一串「code」,因而对密文核算是比较难的工作,可是同态加密就可以完结。 同态加密的意思是,对两个密文进行操作的成果,等于对这两个密文对应的明文 m1、m2 进行操作后再加密的成果。举个比方。假定 Alice 期望工匠帮她把两个金块加工成手镯。在这个加工进程中,她期望工匠无法把这个金块的碎片搜集起来。因而工匠需求凭借一个特别的设备。这个设备是通明的而且带了一把锁(仅有 Alice 可以翻开这把锁拿到设备内部的物体),而且固定了一个手套,工匠可以将双手放到手套里,隔着设备进行精密的加工,可是戴着手套,而且手套无法脱离设备,工匠实践上无法触碰到任何的金块和金块碎片。在这个比方里,设备里的两个金块可以当作原始密文 Encrypt(m1) 和 Encrypt(m2),工匠所做的工作,就好像是他在盒子的遮挡下在操作密文,而 Encrypt(m1+m2) 便是设备里的手镯,Alice 通过解锁取得了手镯,即 m1+m2。

同态加密需求处理的一个中心问题是可以支撑恣意类型的核算。恣意的意思是指加法和乘法,由于一切的核算程序笼统为算术电路表明都可以用加法和乘法完结。传统的联邦学惯用的一般是加法同态加密体系,而闻名的商用暗码算法 RSA 便是一个乘法同态加密算法。最厉害的是全同态加密,指的是关于既支撑加法操作又支撑乘法操作,而且核算次数没有约束的加密算法。这种计划特别十分少,直到 2009 年第一个全同态加密计划被 Gentry 等人提出来。现代的全同态加密体系,一般依据格理论等根底东西,可以对立量子进犯。

安全多方核算

安全多方核算(MPC)是由图灵奖取得者,中国科学院院士姚期智先生最早提出来的。姚先生其时提出了一个百万财主问题,两个财主十分有钱,他们相互之间要比较谁更赋有,可是又不想告知对方自己详细的财富数,一同他们不期望依托一个可信的第三方来完结问题的答复。事实上,MPC 要处理的便是多个参加方在不走漏隐私数据的前提下,怎么协作,完结对一个问题的求解。当然,各方要核算的使命是揭露的。比方说多方之间想要做一个联合的加法或许联合的建模,模型是逻辑回归,需求多少轮等这些细节是约定好的。MPC 的成果输出一般是可以指定的,可以以明文方式输出,也可以以密文方式输出而且分割在多方进行保存。

MPC 有两个方式,一个方式便是用户有一个隐私输入 x ;然后服务供给商有一个隐私输入 y,依据一个揭露的核算函数 f, 两方协作最终会输出一个 f(x,y)。还有一种方式是,用户输入 x,然后服务供给商供给核算函数 f,服务供给商期望把函数 f 藏起来,最终两方协作输出 f(x,y)。这两种方式在事务上是有不同的,一种是算法是揭露的,另一种是算法是躲藏的,可是关于 MPC 底层电路而言,其实质是相同的,算法规划部分其实没有太大不同。

传统的 MPC 技能道路分为两类,别离针对两类不同的电路体系。 一类叫 布尔电路 ,指的是每一个核算单元的表明方式是布尔门(与门、或门、非门);这类布尔电路,会有一套专门的 MPC 暗码协议来处理。另一类叫 算术电路 ,指电路彻底由加法和乘法组成。出于功能功率的原因,不同的电路类型使命需求用选用不同的暗码协议来完结。

安全两方核算所运用的协议一般为混杂电路(GC)结合不经意传输(OT);而安全多方核算(指三方或许三方以上)所运用的协议一般为隐秘同享(SS)结合不经意传输。前者(GC+OT)首要的问题在于核算开支会比较大,而且一般比较适合于做两方之间的隐私核算。它的长处在于需求的通讯轮数比较少。后者的问题在于一般需求迭加多轮 OT,会引进十分高的通讯轮数;它的长处在于核算开支比较小。关于网络要求比较高的这种场景里边不太适合用这种 SS+OT 的方法。

从现在的工程经历来看,业界用 SS+OT 完结依据算术电路的 MPC 计划较多。当然实质上技能的选取仍是跟核算使命相关。许多情况下,比方说你要做 AI 建模触及较多的乘法、线性运算,更适合用算术电路来完结;而假如要做一些比较查询,更适合用混杂电路来处理。

在实践的 MPC 布置问题上,咱们一般会把数据方和核算方分隔。这样可以尽可能地支撑更多的参加方,而且实践的核算节点不会太多,一般会有两个或许三个。不然增多核算节点,会导致通讯轮数指数级的上升,网络开支无法承当。

零常识证明

零常识证明(ZKP)是反直觉的,简略来说是证明者向验证者进行证明「我知道问题的解」,但不直接走漏解,验证者完结验证后会坚信前者知道解可是无法取得任何解的信息。 一般 ZKP 的两方之间需求进行交互通讯,归于一种「交互式证明体系」。实践的规划里,出于通讯功率的考虑,可以将各类 ZKP 体系转成非交互式。零常识证明现在首要仍是用来做认证相关的场景。

传统的零常识证明体系里,一般是形如证明者供给许诺-验证者宣布随机应战-证明者完结应对的交互式「三步曲」。一般证明者可以用相似随机猜想的方法以必定概率完结验证者的应战,需求把这个三步曲进程重复许多轮,来尽可能下降证明者诈骗的概率。现在 ZKP 的十分抢手,出现了如 zk-SNARKs, zk-STARKs, bulletproof 等十分优异的通用类 ZKP 体系,可以完结对恣意论说的证明。

零常识证明在区块链顶用的最多的便是做隐私买卖,首要是指躲藏买卖三要素——付款人,收款人以及金额。现在像 ZCash、Monero 等隐私代币都有很不错的隐私买卖技能。在联盟链里,需求考虑审计等第三方介入的场景,因而需求将零常识证明与审计需求进行技能上的结合。

从技能道路来看,现在零常识证明的算法有个首要的问题是,——一去创立零常识证明体系的时分,整个体系它会有一些初始化的参数,这些参数的创立进程其实是需求必定的信赖假定的。比方可以找一个可信的第三方来创立,创立进程中会用到一些随机数,那这些随机数假如继续不删去的话,取得了这些随机数的人就可以成功地假造证明。这也便是所谓 trust setup 问题。各类通用 ZKP 体系现在均无法很好地处理这个问题,有些是需求通过一个额定机制来完结这个可信的初始化进程,有些是无需可信初始化可是会形成很严重的功率问题。

全面概述七类隐私计算技术:零常识证明、MPC 与同态加密等

署理重加密

署理重加密处理的是一个数据外包同享的问题。 一个典型的比方是, a 想要把她的数据保存到云端,一同不想让云看到这个数据,所以她的数据显然是需求加密再放到云端的。某个时间,b 需求向 a 取得这个数据,a 又不想自己直接把这个数据下载下来解密后再传给 b,那么有没有什么方法完结事务需求?署理重加密便是处理这个问题的。首要,云端有这个 a 的加密数据,云会凭借署理重加密技能把 a 的密文转成 b (可以解开)的密文。所以这儿边有一个显式的密文转化操作。b 通过 a 的授权,从云端下载了转化后的密文,再用自己的密钥解开,就可以取得 a 的数据明文。a 是一个轻核算节点,一切的重型核算都是在云端操作,然后这儿边凭借一个授权进程,云端把这个密文进行核算转化(并不是简略地将 a 的密文解密后用 b 的公钥加密,而是一种特别的密文核算)。

便axbyabaxyybbxy便PSIPSI

mp.weixin.qq.com

版权声明

本文仅代表作者观点,不代表网赚之家本站立场。
本文系作者授权发表,未经许可,不得转载。

评论