# privacy_computation **Repository Path**: MengLi666/privacy_computation ## Basic Information - **Project Name**: privacy_computation - **Description**: 基于隐私计算技术的,中文手写数字识别。该项目使用了,联邦学习,成员推断攻击,和,差分隐私技术。 - **Primary Language**: Python - **License**: MIT - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 4 - **Forks**: 1 - **Created**: 2022-01-07 - **Last Updated**: 2024-05-07 ## Categories & Tags **Categories**: privacy-computing **Tags**: None ## README # 基于隐私计算的中文手写数字识别 #### 关于隐私计算 隐私计算,主要是研究模型共享过程中,针对用户隐私的,攻击和防御手段(这个仅仅是我个人的理解,不是官方的解释)。这里的攻击手段,指的是,一些可以从模型中获取用户隐私的技术。而防御手段,则是应对各种攻击手段的技术。举个例子,某大型银行想要,将机器学习模型共享给其他机构。但模型是由该银行客户的隐私数据训练成的。如果直接将模型分享出去的话,则有可能被人们使用一些技术手段,比如下文中提到的,成员推断攻击,从模型中获取到用户的隐私。为了避免客户隐私泄露,该银行可以使用,差分隐私技术,有效防御成员推断攻击。关于这两个技术的原理,后面将详细介绍。 #### 隐私计算技术的难点 隐私计算技术的难点,是,难以让模型同时拥有,良好的防御性能,和较高的模型预测准确率。 通常来说,为了避免客户的隐私数据,从机器学习模型中泄露出去。常用的防御手段,是在模型的训练过程中,对一些训练参数进行各种形式的加密。该手段通常可以降低客户隐私泄露的可能性。但是,这些加密手段,也带来了一个问题。即,模型预测的准确率,将被大大降低。这个问题,目前在学术界,并没有一个通行的解决方案。 #### 项目介绍 该项目主体是一个,中文手写数字识别。并在模型训练过程中,使用了各种隐私计算技术。具体来说,该项目依次展示了,联邦学习(防御手段),成员推断攻击(攻击手段),和,差分隐私技术(防御手段)。 #### 中文手写数字识别 数据集的总体情况如图1所示。 项目所使用的部分数据集,如图1所示。项目的目的,是使用深度学习和隐私计算技术,然后用这些图片数据集训练模型,从而让模型能识别新出现的数据。
![部分数据集](others/pictures/%E5%9B%BE%E7%89%871.png)
图2.部分数据集
举个例子,当测试数据,为如图2所示的图片时,模型需要识别出,此图片为数字3.
![输入图片说明](others/pictures/%E5%BE%AE%E4%BF%A1%E6%88%AA%E5%9B%BE_20220107175228.png)
图3.一个测试集样本
当测试数据,为如图3所示的图片时,模型需要识别出,此图片为数字0.
![输入图片说明](others/pictures/1641549076(1).png)
图4.一个测试集样本