A Simple Simulation Framework for Federated Learning Based on PyTorch

项目链接:

源代码: GitHub | gitee
Docker 镜像: wenh06/fl-sim
文档（正在完善）:
- GitHub Pages
- Read the Docs

本仓库迁移自 fl_seminar，主体部分是一个基于 PyTorch 的简单的联邦学习仿真框架。

安装
示例
复现的算法
主要模块
命令行接口
自定义算法的实现

安装

可以在命令行中使用以下命令安装：

pip install git+https://github.com/wenh06/fl-sim.git

或者，可以先将仓库克隆到本地，然后在仓库根目录下使用以下命令安装：

pip install -e .

使用者也可以使用 Docker 镜像运行本项目。该镜像是使用 Docker Image CI action 构建的。可以使用以下命令拉取镜像：

docker pull wenh06/fl-sim

通过如下的命令可以交互式地运行镜像：

docker run -it wenh06/fl-sim bash

关于 Docker 镜像更多的使用方法，请参考 Docker 官方文档。

示例

点击展开

以下代码片段展示了如何使用框架在 FedProxFEMNIST 数据集上使用 FedProx 算法训练模型。

from fl_sim.data_processing.fedprox_femnist import FedProxFEMNIST
from fl_sim.algorithms.fedprox import (
    FedProxServer,
    FedProxClientConfig,
    FedProxServerConfig,
)

# create a FedProxFEMNIST dataset
ds = FedProxFEMNIST()
# choose a model
model = ds.candidate_models["cnn_femmist_tiny"]
# set up the server and client configurations
server_config = FedProxServerConfig(200, ds.DEFAULT_TRAIN_CLIENTS_NUM, 0.7)
client_config = FedProxClientConfig(ds.DEFAULT_BATCH_SIZE, 30)
# create a FedProxServer object
s = FedProxServer(model, ds, server_config, client_config)
# normal centralized training
s.train_centralized()
# federated training
s.train_federated()

复现的算法

算法	文章	源仓库	标准测试用例上的效果
FedAvg 1	AISTATS2017	N/A	✔️
FedOpt 2	arXiv:2003.00295	N/A	✔️
FedProx	MLSys2020	GitHub	✔️ ❓
pFedMe	NeurIPS2020	GitHub	⁉️
FedSplit	NeurIPS2020	N/A	✔️ ❓
FedDR	NeurIPS2021	GitHub	⁉️
FedPD	IEEE Trans. Signal Process	GitHub	⁉️
SCAFFOLD	PMLR	N/A	✔️ ❓
ProxSkip	PMLR	N/A	✔️ ❓
Ditto	PMLR	GitHub	✔️
IFCA	NeurIPS2020	GitHub	✔️
pFedMac	arXiv:2107.05330	N/A	⁉️
FedDyn	ICLR2021	N/A	❓
APFL	arXiv:2003.13461	N/A	❓

标准测试效果图：

Client sample ratio 10% Client sample ratio 30% Client sample ratio 70% Client sample ratio 100%

✔️ 算法在标准测试用例上的效果符合预期。
✔️ ❓ 算法在标准测试用例上的效果低于预期。
❓ 算法暂未在标准测试用例上进行测试。
⁉️ 算法在标准测试用例上的发散，相关的算法实现需要进一步检查。

主要模块

Data Processing

点击展开

data_processing 模块包含数据预处理、IO 等代码，其中包含以下数据集：

FedCIFAR
FedCIFAR100
FedEMNIST
FedMNIST
FedShakespeare
FedSynthetic
FedProxFEMNIST
FedProxMNIST
FedProxSent140

以上每一个数据集都被封装在一个类中，提供以下功能：

数据集的自动下载和预处理
数据集的切分（分配给子节点）方法 get_dataloader
预置了一系列候选模型，可以通过 candidate_models 属性获取
基于模型预测值的 evaluate 方法，可以评测模型在数据集上的性能
一些辅助方法，用于数据可视化和参考文献的获取（biblatex 格式）

此外， LIBSVM 数据集列表可以通过如下语句获取

pd.read_html("https://www.csie.ntu.edu.tw/~cjlin/libsvmtools/datasets/")[0]

更新: 一部分计算机视觉数据集的训练集支持动态数据增强。基类 FedVisionDataset 的签名为

FedVisionDataset(
    datadir: Union[str, pathlib.Path, NoneType] = None,
    transform: Union[str, Callable, NoneType] = "none",
) -> None

通过将 transform 参数设置为 "none" （这也是 transform 参数的默认值），训练集将被封装在一个静态的 TensorDataset 中。通过将 transform 参数设置为 None，训练集将使用内置的动态数据增强，例如 FedCIFAR100 使用 torchvision.transforms.RandAugment。

注意，大部分计算机视觉的联邦数据集包含的数据都是经过预处理后的而不是原始像素值，因此不支持使用 torchvision.transforms 进行动态数据增强。

👉 返回目录

Models

点击展开

models 模块包含预定义的（神经网络）模型，其中大部分结构都非常简单：

MLP
FedPDMLP
CNNMnist
CNNFEMnist
CNNFEMnist_Tiny
CNNCifar
RNN_OriginalFedAvg
RNN_StackOverFlow
RNN_Sent140
ResNet18
ResNet10
LogisticRegression
SVC
SVR

以上大部分模型都是之前文献中使用过的，或是基于此进行修改的。

通过调用 model_size 或 model_size_ 属性可以获取模型的大小（参数数量和内存占用）。

👉 返回目录

Optimizers

点击展开

optimizers 模块包含用于解决联邦优化问题内循环（子节点上的）优化问题的优化器。除了 torch 和 torch_optimizers 中的优化器外，本模块实现了以下优化器：

ProxSGD
FedPD_SGD
FedPD_VR
PSGD
PSVRG
pFedMe
FedProx
FedDR

其中大部分都是基于 ProxSGD 的变体，即目标是带有临近项的优化问题。

👉 返回目录

Regularizers

点击展开

regularizers 模块包含用于对模型参数进行正则化的正则化项（用类来实现）。正则化项的目的是防止模型过拟合，从而提高模型的泛化能力。本模块实现了以下正则化项：

L1Norm
L2Norm
L2NormSquared
NullRegularizer

以上的正则化项都是基类 Regularizer 的子类，可以通过将正则化项的名称传递给函数 get_regularizer 来获取。正则化项都有 eval 和 prox_eval 两个方法，分别用于计算正则化项的值和其临近项的值。

👉 返回目录

Compression

点击展开

compressors 模块包含了模型参数压缩器的实现。压缩器的目的是减少模型参数的传输量，从而减少通信开销。

👉 返回目录

Utils

点击展开

utils 模块包含了一些工具函数，例如数据下载、日志记录、可视化等。

TxTLogger: 用于将训练指标记录到文本文件中，同时也会在控制台以适合人类阅读习惯的格式打印出来。
~~CSVLogger: 用于将训练指标记录到 CSV 文件中。不推荐使用，因为存储消耗较大。~~
JsonLogger: 用于将训练指标记录到 JSON 文件中。也可以保存为 YAML 文件。

👉 返回目录

Visualization Panel

本框架实现了一个可视化面板，用于可视化联邦学习算法的训练结果。它基于 ipywidgets 和 matplotlib 进行开发，可以在 Jupyter notebook 中使用。它具有以下功能：

自动搜索并显示指定目录中完整实验的日志文件。
自动解析日志文件，并将训练指标进行聚合，利用 matplotlib 生成曲线。
支持对绘制的图像进行交互式操作，包括缩放、字体选择、曲线平滑等。
支持将绘制的图像保存为 PDF/SVG/PNG/JPEG/PS 等格式的文件。
支持将不同实验曲线进行合并，例如可以将使用不同随机数种子的 FedAvg 算法的数值曲线合并成一条均值曲线。合并后的曲线可以选择是否显示标准差、标准误差、分位数、四分位距等误差范围。

下面的 GIF （使用 ScreenToGif 制作生成）是可视化面板的演示示例：

注意： 若希望在 Linux 系统下（例如 Ubuntu）上使用 Windows 字体，可以执行以下命令获取相关字体：

sudo apt install ttf-mscorefonts-installer
sudo fc-cache -fv

命令行接口

本仿真框架提供了命令行接口（CLI），用于一次性执行多个联邦学习实验。命令行接口只有一个参数，即实验的配置文件（YAML 格式）路径。配置文件的示例可以在 example-configs 文件夹中找到。例如，在 all-alg-fedprox-femnist.yml 文件中，我们写入了如下的配置：

点击展开

# Example config file for fl-sim command line interface

strategy:
  matrix:
    algorithm:
    - Ditto
    - FedDR
    - FedAvg
    - FedAdam
    - FedProx
    - FedPD
    - FedSplit
    - IFCA
    - pFedMac
    - pFedMe
    - ProxSkip
    - SCAFFOLD
    clients_sample_ratio:
    - 0.1
    - 0.3
    - 0.7
    - 1.0

algorithm:
  name: ${{ matrix.algorithm }}
  server:
    num_clients: null
    clients_sample_ratio: ${{ matrix.clients_sample_ratio }}
    num_iters: 100
    p: 0.3  # for FedPD, ProxSkip
    lr: 0.03  # for SCAFFOLD
    num_clusters: 10  # for IFCA
    log_dir: all-alg-fedprox-femnist
  client:
    lr: 0.03
    num_epochs: 10
    batch_size: null  # null for default batch size
    scheduler:
      name: step  # StepLR
      step_size: 1
      gamma: 0.99
dataset:
  name: FedProxFEMNIST
  datadir: null  # default dir
  transform: none  # none for static transform (only normalization, no augmentation)
model:
  name: cnn_femmist_tiny
seed: 0

strategy 字段指定了网格搜索的策略。 algorithm 字段指定了联邦学习算法的超参数：其中 name 字段指定了算法的名称，server 字段指定了中心节点的超参数，client 字段指定了子节点的超参数。 dataset 字段指定了实验使用的数据集，model 字段指定了实验使用的模型。

自定义算法的实现

利用本仿真框架实现的注册机制（registration functions），可以很方便地实现自定义的联邦学习算法，数据集，优化器等。例如，在文件 custom_confi.yml 中，我们写入了如下的配置：

algorithm.name: test-files/custom_alg.Custom
dataset.name: test-files/custom_dataset.CustomFEMNIST

其中 test-files/custom_alg.py， test-files/custom_dataset.py 分别是自定义算法和自定义数据集的文件，Custom 是自定义算法的名称，CustomFEMNIST 是自定义数据集的名称。我们可以在本仓库的根目录下执行以下命令来执行仿真数值试验

fl-sim test-files/custom_conf.yml

若 algorithm.name 和 dataset.name 是绝对路径，则可以在任意位置执行该命令。

自定义联邦学习算法

在文件 test-files/custom_alg.py 中，我们实现了一个自定义的联邦学习算法 Custom，该算法的实现细节如下：将算法的超参数配置写入 CustomServerConfig 和 CustomClientConfig 类中，这两个类分别继承了 ServerConfig 和 ClientConfig 类。将算法的实现写入 CustomServer 和 CustomClient 类中，这两个类分别继承了 Server 和 Client 类。同时，利用装饰器 register_algorithm，我们将 CustomServerConfig，CustomClientConfig，CustomServer，CustomClient 注册到了本仿真框架中，例如：

@register_algorithm()
@add_docstring(server_config_kw_doc, "append")
class CustomServerConfig(ServerConfig):
    ...

之后在利用命令行接口执行仿真数值试验时，就可以通过 algorithm.name 指定 Custom 算法。

Custom Datasets

类似地，我们可以实现自定义的联邦数据集。在文件 test-files/custom_dataset.py 中，我们实现了一个自定义的联邦数据集 CustomFEMNIST，其继承了 FEMNIST 类。同时，利用装饰器 register_dataset，我们将 CustomFEMNIST 注册到了本仿真框架中。

Custom Optimizers

自定义的优化器也可以通过类似的方式实现，即将其实现为 torch.optim.Optimizer 的子类，并利用装饰器 register_optimizer 将其注册到本仿真框架中。

Footnotes

FedAvg 是作为 FedOpt 的特例进行实现的。 ↩
包括 FedAdam, FedYogi, FedAdagrad 等算法。 ↩

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README-zh.md

README-zh.md

A Simple Simulation Framework for Federated Learning Based on PyTorch

安装

示例

复现的算法

主要模块

Nodes

Data Processing

Models

Optimizers

Regularizers

Compression

Utils

Visualization Panel

命令行接口

自定义算法的实现

自定义联邦学习算法

Custom Datasets

Custom Optimizers

Files

README-zh.md

Latest commit

History

README-zh.md

File metadata and controls

A Simple Simulation Framework for Federated Learning Based on PyTorch

安装

示例

主要模块

命令行接口

自定义算法的实现

自定义联邦学习算法

Custom Datasets

Custom Optimizers

Footnotes