# privacy_computation **Repository Path**: MengLi666/privacy_computation ## Basic Information - **Project Name**: privacy_computation - **Description**: 基于隐私计算技术的，中文手写数字识别。该项目使用了，联邦学习，成员推断攻击，和，差分隐私技术。 - **Primary Language**: Python - **License**: MIT - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 5 - **Forks**: 1 - **Created**: 2022-01-07 - **Last Updated**: 2025-07-19 ## Categories & Tags **Categories**: privacy-computing **Tags**: None ## README # 基于隐私计算的中文手写数字识别 #### 关于隐私计算隐私计算，主要是研究模型共享过程中，针对用户隐私的，攻击和防御手段（这个仅仅是我个人的理解，不是官方的解释）。这里的攻击手段，指的是，一些可以从模型中获取用户隐私的技术。而防御手段，则是应对各种攻击手段的技术。举个例子，某大型银行想要，将机器学习模型共享给其他机构。但模型是由该银行客户的隐私数据训练成的。如果直接将模型分享出去的话，则有可能被人们使用一些技术手段，比如下文中提到的，成员推断攻击，从模型中获取到用户的隐私。为了避免客户隐私泄露，该银行可以使用，差分隐私技术，有效防御成员推断攻击。关于这两个技术的原理，后面将详细介绍。 #### 隐私计算技术的难点隐私计算技术的难点，是，难以让模型同时拥有，良好的防御性能，和较高的模型预测准确率。通常来说，为了避免客户的隐私数据，从机器学习模型中泄露出去。常用的防御手段，是在模型的训练过程中，对一些训练参数进行各种形式的加密。该手段通常可以降低客户隐私泄露的可能性。但是，这些加密手段，也带来了一个问题。即，模型预测的准确率，将被大大降低。这个问题，目前在学术界，并没有一个通行的解决方案。 #### 项目介绍该项目主体是一个，中文手写数字识别。并在模型训练过程中，使用了各种隐私计算技术。具体来说，该项目依次展示了，联邦学习（防御手段），成员推断攻击(攻击手段)，和，差分隐私技术（防御手段）。 #### 中文手写数字识别数据集的总体情况如图1所示。项目所使用的部分数据集，如图1所示。项目的目的，是使用深度学习和隐私计算技术，然后用这些图片数据集训练模型，从而让模型能识别新出现的数据。

![部分数据集](others/pictures/%E5%9B%BE%E7%89%871.png)

图2.部分数据集

举个例子，当测试数据，为如图2所示的图片时，模型需要识别出，此图片为数字3.

![输入图片说明](others/pictures/%E5%BE%AE%E4%BF%A1%E6%88%AA%E5%9B%BE_20220107175228.png)

图3.一个测试集样本

当测试数据，为如图3所示的图片时，模型需要识别出，此图片为数字0.

![输入图片说明](others/pictures/1641549076(1).png)

图4.一个测试集样本