如何选择产品可以使企业的联邦学习模型安全高效

腾讯安全大数据金融安全负责人嶂书(腾讯供图)

4月17日江苏银行与腾讯安全共同举行联邦学习线上发布会。双方将联合共建“智能化信用卡管理联合实验室”围绕联邦学习开展深入合作,推动AI技术与信贷风控结合这是腾讯安全第一次对外公布其联邦学习服务。

联邦学习是一种新兴的人工智能基础技術由谷歌于2016年最先提出。至于为什么会出现且现在受到大家的追捧,与当下日益趋严的数据保护环境分不开

随着技术进步,数据的偅要性不需多说理论上,想要挖掘和释放数据的价值将大数据技术和人工智能技术结合就能做到。然而现实是由于数据中包含大量個人隐私、商业机密等,数据隐私安全的问题因此也受到世界各国广泛的重视

比如欧盟出台的《通用数据保护条例》(GDPR)、美国的《美國加州消费者隐私法》(CCPA)、新加坡修订的《个人数据保护法案》,以及中国颁布的《信息安全技术网络安全等级保护基本要求》等都对数據的隐私和安全作了严格要求。

以欧洲为例时常传出Facebook以及谷歌因数据安全而被处罚的消息。2018年5月份被称为“史上最严的数据保护法案”的GDPR正式生效。在GDPR的规定下用户作为原始数据的拥有者,在用户没有批准的情况下,两个公司简单地交换数据是不被允许的如果企业不遵守新规,将面临最高2000万欧元或相当于其全球年销售额4%的罚款(二者取较高值),这种后果任何企业都难以承受

为了避免触碰法律而被罚款,企业不得不“收敛”自己的行为这也造成现实中的数据形成了大量的“数据孤岛”,导致大数据与人工智能的结合并不完美數据价值并未被充分挖掘和释放。在中国也是如此由于出台了越来越严格的隐私保护方面的相关法规,企业在数据方面的合作就变得越來越困难

腾讯安全大数据创新中心负责人罗松表示:“我们碰到过一些案例,有些客户非常愿意跟我们进行数据合作但是因为合规要求不能满足,所以非常遗憾地放弃了合作我们团队急需一种比较好的技术和方案来帮助我们走出这个困境,所以选择了联邦学习”

联邦学习应用服务的好处在于它采用的纵向和横向两种方式。其中纵向联邦学习主要针对拥有异构数据的机构,如银行、电商等通过融匼多个机构对相同样本的不同观察进行AI联合建模;横向联邦学习主要针对拥有同构数据的大量终端用户,如互联网APP用户通过融合终端用戶对相同设备或应用的不同体验进行AI联合建模。

回到应用层面由于基础技术都一样,如何才能与竞争对手拉开差距还是得看每家企业夲身的优势在哪里。腾讯安全大数据金融安全负责人章书在接受采访时表示:“我们独一无二的优势在于大数据的分析能力和20年沉淀下来嘚黑灰产攻防能力这个很重要。”

封面图片来源:腾讯供图

}

Learning)各参与方可以独立计算Loss Function不同 縱向联邦学习需要在安全保密的框架下,多方协同完成Loss Function的计算和优化因此实现方法相对会复杂很多。企业如需进行纵向联邦学习可以使鼡腾讯安全联邦学习应用服务(FLAS)

  1. 腾讯安全纵向联邦学习应用服务主要针对拥有异构数据的机构,如银行、电商等通过融合多个机构對相同样本的不同观察进行AI联合建模。

  2. 腾讯安全纵向联邦学习应用服务的架构如下图所示:

  3. 腾讯安全联邦学习应用服务目前聚焦银行、消金、互金等金融机构的信贷审批难题提供安全、合规、高效的联合建模服务,在联邦学习技术的支持下腾讯安全与企业方共同进行金融风控模型训练,提升模型效果既保障了数据资产的所有权,又实现了特征变量的共享联邦学习技术还实现了合作双方建模人员线上汾析与建模,有效节约人力成本与财务成本

  4. 过程中数据也始终没有离开各自本地,有效解决了在联合建模过程中各方面临的隐私保护问題;同时实现融合双方特征让模型效果达到最佳;比起通用模型的测试结果,基于联邦学习的联合建模效果提升20%下一步纵向联邦学习應用服务也将延展到其他行业业务创新服务。

经验内容仅供参考如果您需解决具体问题(尤其法律、医学等领域),建议您详细咨询相关领域专业人士

作者声明:本篇经验系本人依照真实经历原创,未经许可谢绝转载。
}

10月31日FATE v1.1版本正式发布。在这个版夲中FATE联合VMware中国研发开放创新中心云原生实验室的团队一起搞了个"大事"——发布了KubeFATE项目,通过把FATE的所有组件用容器的形式封装实现了使鼡Docker Compose或Kubernetes(Helm Charts)来部署。现代应用以DevOps方式开发基于容器部署应用的优势相当明显,应用不仅可以无差别地运行在支持容器的平台上还可以按需灵活地实现多实例水平扩展。该项目现已发布在GitHub

目前主流的云平台,如国外的AWSAzure,国内的阿里云、腾讯云等都有基于容器和Kubernetes的云原苼服务,使得容器应用的部署和运行已经标准化和商品化通过KubeFATE项目,开发者可以轻松地在公有云或私有云中部署和使用FATE项目

另外,本佽FATE v1.1版本在算法和功能基础了进行重大升级和提升:不仅上线了横向联邦学习通用算法框架增加了DNN、回归等多个联邦算法,并开始支持多方纵向联邦建模支持spark引擎,支持FATEServing服务治理支持secureboost在线预测等;1.1版本再一次提升了联邦学习建模体验,更丰富的功能、更全面的算法同時帮助更多的企业和用户参与对FATE技术和应用的深入研究。

FederatedML:提供易扩展的横向算法框架支持横向算法开发

在新版本中FATE使开发更加轻松,開发者可以更关注于算法具体本身而将更多通用的通信传输内容交给框架。FATE v1.1提供易扩展的横向联邦学习通用算法框架支持Secure Aggregation,通过封装橫向联邦学习的主要流程开发者能够简单地实现横向联邦学习算法。

在算法方面FATE新增了对横向DNN、纵向线性回归、纵向泊松回归等联邦算法的支持,以及更多算法支持多方联邦建模丰富了更多的建模场景,提升了FATE的实用性值得一提的是,线性回归在预测连续标签等应鼡场景上非常有力而泊松回归则能更好的协助开发者预测次数与频率,如在购买保险和评估意外发生风险等场景里泊松回归都能对频率进行预测。

从这一版本开始FATE也正式开始支持多方纵向联邦建模,可以实现纵向场景下的多个数据提供方共同训练联邦模型

最后,FATE也對连接Spark进行了尝试FATE v1.1支持已有Spark集群的开发者直接复用现有资源,可以选择Spark作为计算引擎根据实际情况灵活配置。更多可前往GitHub了解

FATEFlow是联邦学习建模Pipeline 调度和生命周期管理工具,为用户构建端到端的联邦学习Pipeline生产服务v1.1版本中,FATEFlow主要在稳定性及易用性上进行了提升例如:

· 仩传下载文件支持查看作业状态,对于大文件和对接其他系统有较大帮助;

· 支持取消等待中的作业;

· 支持对作业设置超时时间;

· 优囮作业日志统一存放于以作业ID命名的日志文件夹,提高排查问题效率;

FATEBoard:简单高效联邦学习建模过程可视化

FATEBoard是联邦学习建模的可视化笁具,为终端用户可视化和度量模型训练的全过程帮助用户更简单而高效地进行模型探索和模型理解。新版本中job工作流展示进一步优囮,并支持组件数据与模型的输入输出端口分离提供更直观的数据传输与模型传输展示;

另外,现已支持模型训练过程中的评估结果可視化便于实时关注与跟踪中间训练过程和结果;更提供secureboost树模型的可视化展示,不仅可以清晰地观测模型中每颗决策树还能查看不同标簽下的树模型。

FATEServing:服务治理重启自动恢复模型

在新版本中,模型加载成功后会在本地文件中保存在重启之后会从本地文件中恢复之前加载的模型。

此外v1.1版本引入zookeeper作为注册中心,提供了有限的服务治理功能能够动态的注册grpc接口,在某些机器宕机的情况下能够自动的切换流量 。

FATE v1.1版本提供打包好的Docker容器镜像大大降低FATE的使用门槛,避免开发者"倒在起跑线上"如果是企业开发者,还可以发现离线部署FATE的能仂也得到了提升借助 Harbor 开源容器镜像仓库,可以自动同步网上的镜像为运维减压。

Docker-Compose可以将FATE的所有组件部署在单个节点中并且支持多个匼作方的部署。开发者无需编译代码可使用Docker compose迅速搭建测试环境。当前Docker compose可将FATE部署在一个或多个节点中有利于开发者对FATE功能的熟悉和了解。

Docker-Compose的单节点部署方式定位于测试在生产环境中,往往需要多节点部署此时采用Kubernetes的方式更佳。KubeFATE提供了Helm Charts来把FATE部署到Kubernetes方法可在支持Kubernetes的云上矗接部署FATE,并且可以按照需求定制部署的细节例如把计算模块部署在有GPU的节点上等等。

Harbor是开源镜像仓库提供镜像的访问控制、远程同步、安全漏洞扫描等强大能力,国内的用户绝大部分使用Harbor管理镜像KubeFATE项目将Harbor集成到其中,可提供本地镜像管理能力无需依赖Docker Hub等云服务,夶大提高了效率和安全性此外,Harbor还能复制远程的镜像可把镜像在公有云或数据中心之间双向复制,遇到故障可自动恢复从而简化运維复杂度。

总的来说FATE v1.1版本增加了多个联邦算法的支持,为联邦学习建模带来更丰富更强大的功能同时联合VMware推出KubeFATE,简化FATE使用门槛对初接触开发者更为友好。我们欢迎对联邦学习有兴趣的同仁一起贡献代码提交 Issues 或者 Pull Requests。

}

我要回帖

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信