APP
数据隐私渐成AI“掣肘” 隐私计算+AI是否为破局之法?
2020-07-29 48979 0

人工智能(Artificial Intelligence)风云再起。

从蒸汽时代到电气和信息化时代、再到未来的数字化时代,历史变局的机遇期再一次徐徐展开,人工智能作为新一轮科技革命与数字化革新的重要驱动引擎,已经成为各国家科技竞争主导权的核心领域。人工智能正在深刻改变着政治、经济、生活等模式轨迹,在不知不觉中影响着社会发展。

1. 人工智能的“掣肘”

而在当下,人工智能的发展也面临着诸多问题。其中核心便是数据与人工智能的关系。

目前人工智能在与数据相关的各种应用场景中获得了广泛的使用。其中机器学习、深度学习等技术通过收集大量的数据进行训练获得模型,之后在不同的场景下利用模型对单个用户的数据进行处理。AI在模型训练和推断过程中,各类数据不断被归集,而AI的模型本身也是非常重要的一种数据,可以说,数据是承载AI不断发展的沃土。

AI技术使用的基本模式是通过不断收集数据进行训练来优化AI模型。但当前这一模式已经遇到了极大的瓶颈——数据隐私问题。同时,数据作为一种极为特殊的资产,拥有数据的企业也不愿意真正地彼此分享。数据的多样性直接决定了模型的精度,进而决定了商业成本与风险。从 AI 算法的角度来看,数据越多越好;从隐私保护的角度来看,数据暴露得越少越好。这种内在的“矛盾”已经成为 AI 技术进一步使用的最大障碍。

2. Rosetta:隐私AI的底层基石

Rosetta正是由此而生。Rosetta名字取自古埃及的罗塞塔石碑(Rosetta Stone)。其上记载着古埃及象形文字,埃及草书和古希腊文三种文字。这里Rosetta寓意着承载和结合隐私计算、区块链和AI三种典型的技术。

Rosetta开源框架通过隐私计算技术,可以在保证数据隐私的前提下进行 AI 模型的训练与推断。最大限度地利用数据的多样性,也最大限度地保证数据隐私。

从实用角度来说,Rosetta开源框架是面向 AI 开发者、AI 研究人员的工具。与此同时也需要了解、熟悉隐私计算技术的开发者与研究人员来支撑和完善Rosetta。

Rosetta的目的和期望是可以兼容各种主流的AI框架。当前版本的Rosetta是以TensorFlow作为首选,可以降低熟悉TensorFlow的AI工程师使用隐私计算的技术门槛。如果已经有了一个AI应用,那么工程师只需要修改极少量的代码,就可以将原先的应用迁移到隐私计算的框架下。

面向开发者,Rosetta开源框架具备以下特点及优势:

高效性

充分利用TensorFlow框架的工业级优化支持各类平台

Rosetta采用了密码学算法作为底层技术支撑。出于性能的考虑,密码学算法通常采用C/C++作为编程语言,而TensorFlow的底层实现也采用了C/C++。Rosetta在保持底层 C/C++ 实现密码算法高性能的同时,有机地结合TensorFlow框架中对于并行计算的工业级优化,在保持易用性的前提下,依然保证算法的高效性。

易用性

导入一行代码即可将TensorFlow代码转换成隐私计算模式

Rosetta的设计初衷之一就是要做到简单好用。可以从隐私计算和AI两个不同的角度来理解这个特性。

实现隐私计算的核心技术是密码学,而这是一门较为复杂,学习曲线较高,涉及多类数学理论的学科。让AI开发者去熟悉和掌握复杂的密码学协议和算法是十分不现实的。另一方面,AI算法繁琐复杂,如果用密码学算法来逐一进行定制,成本非常高,既不利于Rosetta后续的扩展,也不利于开发者使用。

Rosetta的做法是通过隐私计算算法将AI框架里的各类基本操作(称为“算子”,operation)转化为“隐私算子”,即算子的功能不发生改变,同时支持在隐私保护前提下的使用。因此,AI开发者可以很容易地用各种各样的隐私算子,通过组合,构建出开发者想要的AI模型,并且是在数据提供方支持以隐私保护的方式进行模型训练和模型推断。

Rosetta完全保留了TensorFlow的接口 API。

AI 开发者可以在明文状态下利用TensorFlow来调整模型,一旦需要引入多方数据进行处理,只要简单地引入下面的包即可自动转化为隐私状态下的计算:import latticex.rosetta

灵活性

支持多种隐私算法并可自由组合AI算法适配不同场景需求

Rosetta支持对同一个隐私算子不同技术的实现方式,因此可以更好地去适配不同的业务场景。Rosetta支持各类隐私计算算法,包括密码学中的安全多方计算、零知识证明、同态加密以及联邦学习和可信执行环境。

比如实现一个逻辑回归训练,从Rosetta的角度来看,其实算子的表达式都是与Tensorflow一致的,仅需要在程序的头部进行一些小小的改动,比如加载数据集的代码从原先的明文读取数据文件改为Rosetta的远程连接接口的方式。

同时,在训练完毕后,模型的归属上,开发者也可以通过一些简便的Rosetta函数调用,通过隐私算法中的秘密分享技术,实现将密文状态的模型进行拆分和分配。如果开发者需要将模型单独分配给其中一方,也可以找到相应的Rosetta函数,通过秘密分享中的重构算法还原出模型明文。

内容来源:矩阵元 作者:矩阵君

版权声明:本文仅为传播消息之用,不代表币源社区立场,文章不构成投资建议。如需转载,请务必注明文章原作者以及来源,部分图片来源于网络,我们尊重版权,如有疑问敬请联系,我们将核实并删除。

我要评论
字数上限500
评论(0)