北京儿童插座价格联盟

【采访】张金:共享时代的数据匿名化

只看楼主 收藏 回复
  • - -
楼主

主题为“共享时代的网络信息安全”的“2017网络信息安全高峰论坛”于3月16日在北京香格里拉饭店举行。阿里数据安全高级专家张金,为与会的各位嘉宾带来了《共享时代的数据匿名化》的主题演讲。此次汇报中,张金重点分享了阿里在数据匿名化方面的思考。

如今数据不再是孤岛,数据连接在一起可以产生更大的价值,但是当数据需要进入共享时代就带来了矛盾。张金表示,今天很多数据其实是个体的数据,但是如果希望对它做分析挖掘,就势必对个人隐私进行冲击。如何在保证个人隐私的情况下又能够对数据进行很好的利用,这是非常重要的课题。


首先,什么是匿名化?张金在汇报中给出了具体的特点:含有个体信息的数据、希望可以公开数据为公众提供信息服务、不希望个体信息被泄露、对准标识(quasi-identifier)进行调整、保持敏感属性(sensitive attribution)不变,这类的数据信息是需要用匿名化技术来处理的。


如何对机密数据的关键部分进行模糊处理,使其既能保护数据隐私又能使数据能够被处理以获得有用信心而无需担心其他人捕获该数据,张金给出了可能的解决方案:差分隐私(Differential Privacy)、同态加密(Homomorphic encryption)、零知识证明(Zero-knowledge proof)。差分隐私方案是对查询结果要加拉布拉斯的噪声,使得在一个具体点上没办法去区分具体是哪个数据,目前已经比较成熟,在最近的IOS10上面已经很成功的应用了这样的技术保护大家的隐私;同态加密方案,是直接在加密的文件上进行计算,同时保证获得正确的结果。这个方式更多还是理论化的思考,有一些算法中的设计;零知证明方案,证明方(prover)向求证方(verifier)证明一个结论,但是不提供任何关于结论(正确或错误)以外的信息,而求证方不能通过这个结论向任何第三方再次证明。


最后张金也给出了他在数据匿名化方面的几点总结和思考,他指出,隐私的保护不仅是数据的属性,也是算法的属性;新的技术提供了可能的解决方案,但大部分还停留在实验室阶段;隐私和数据价值的发掘是在矛盾中不断成长的;在做数据挖掘利用过程中,是如履薄冰,谨慎前行,每一步都是在往前探索一个新的一步。


 更多内容,请点击左下“阅读原文”




举报 | 1楼 回复

友情链接