Multilayer_Perceptron by Rust

用Rust实现基础的全连接神经网络，并用mnist数据集进行训练。

pytorch result

rust result

运行方法

git clone https://github.com/Dragon-GCS/rust-dnn.git
cd rust-dnn
cargo build -r

函数签名使用引用传递，尽可能避免数据复制, 优化后batch时间 6ms -> 4ms
数组填充元素时两种方法
1. 使用Vec::with_capacity预先分配内存，在逐个推入元素。
2. 使用0初始化数组，然后逐个赋值。
两种方法在性能上没有明显差异，但在做矩阵运算时需要根据行列计算索引，有额外的计算开销
使用rayon并行计算梯度，优化时间从4ms -> 1.6ms

并行计算时需要考虑线程开销，梯度并行计算只有f64的复制损耗，计算开销大于线程开销，多线程提升明显