sparse.h

#include <vector>
#include <map>
#include <functional>
#include <cstring>  // memcpy
#include <cstdio>

#include <assert.h>

#include "util.h"


class LilMatrix {
    int n;  // n*n square matrix
    std::vector<std::map<int, float>> mat;  // list of dict?!

public:
    friend class CsrMatrix;

    LilMatrix(int n) {
        this->n = n;
        mat.resize(n);
    }
    int getN() const { return n; }
    void addValue(int row, int col, float val) {
        if (row != -1 && col != -1)
            mat[row][col] += val;
    }
    void setValue(int row, int col, float val) {
        mat[row][col] = val;
    }
    float at(int i, int j, float default_ = 0.0) const {
        auto p = mat[i].find(j);
        if (p == mat[i].end()) return default_;
        return p->second;
    }

    // return true iff the matrix is strictly symmetric
    bool isSymmetric() const {
        for (int i = 0; i < n; i++) {
            for (std::pair<int, float> jw : mat[i]) {
                int j = jw.first;
                if (j >= i) break;
                auto p = mat[j].find(i);
                if (p == mat[j].end() || p->second != jw.second)
                    return false;
            }
        }
        return true;
    }

    // visualize
    void print(FILE* fp = stdout) const {
        char* c = new char[n];
        for (int i = 0; i < n; i++) {
            for (int j = 0; j < n; j++) c[j] = ' ';
            for (std::pair<int, float> jw : mat[i]) {
                if (jw.second > 0.0) c[jw.first] = '+';
                if (jw.second < 0.0) c[jw.first] = '-';
                if (std::isnan(jw.second)) c[jw.first] = '#';
                //printf("%f ", jw.second);
            }
            fwrite(c, 1, n, fp);
            fputc('\n', fp);
        }
        delete[] c;
    }
    void printOctave(FILE* fp = stdout) const {
        fprintf(fp, "[");
        for (int i = 0; i < n; i++)
            for (int j = 0; j < n; j++) {
                fprintf(fp, "%.12lg%c", this->at(i, j), j + 1 == n ? ';' : ',');
            }
        fprintf(fp, "];");
    }

    // res = mat * src
    template<typename vec>
    void matvecmul(const vec* src, vec* res) const {
        for (int i = 0; i < n; i++) {
            res[i] = vec(0.0);
            for (std::pair<int, float> jw : mat[i]) {
                res[i] += jw.second * src[jw.first];
            }
        }
    }

    // transpose
    LilMatrix transpose() const {
        LilMatrix res(n);
        for (int i = 0; i < n; i++) {
            for (std::pair<int, float> jw : mat[i]) {
                res.addValue(jw.first, i, jw.second);
            }
        }
        return res;
    }

    // Incomplete Cholesky factorization
    // result in an lower triangular matrix
    LilMatrix incompleteCholesky1() const {
        LilMatrix res(n);
        for (int i = 0; i < n; i++) {
            float diag = sqrt(abs(this->at(i, i)));
            res.addValue(i, i, diag);
            for (std::pair<int, float> kw : mat[i]) {
                int k = kw.first;
                if (k > i) res.addValue(k, i, kw.second / diag);
            }
        }
        return res;
    }

};


class CsrMatrix {
    int n;  // n*n square matrix
    std::vector<int> rows;  // see Wikipedia
    std::vector<int> cols;
    std::vector<float> vals;

public:
    // for convertion from LiLMatrix
    enum FromLilMode {
        FROM_LIL_NONZERO,  // only nonzero elements
        FROM_LIL_FORCE_DIAG,  // must have diagonal, including zeros
        FROM_LIL_LOWER,  // lower triangular with diagonal
        FROM_LIL_UPPER,  // upper triangular with diagonal
    };

    CsrMatrix(): n(0) {}
    CsrMatrix(const LilMatrix& lil, FromLilMode mode = FROM_LIL_FORCE_DIAG) {
        this->n = lil.n;
        rows.push_back(0);
        for (int i = 0; i < n; i++) {
            for (std::pair<int, float> indice : lil.mat[i]) {
                if (
                    (indice.second != 0.0 || (mode != FROM_LIL_NONZERO && indice.first == i))
                    && !(mode == FROM_LIL_LOWER && indice.first > i)
                    && !(mode == FROM_LIL_UPPER && indice.first < i)
                 ) {
                    cols.push_back(indice.first);
                    vals.push_back(indice.second);
                }
            }
            rows.push_back((int)cols.size());
        }
    }
    int getN() const { return n; }
    int getNonzeros() const { return (int)vals.size(); }

    // square of norm of a vector
    float vecnorm2(const float* r) const {
        float ans = 0.0;
        for (int i = 0; i < n; i++) ans += r[i] * r[i];
        return ans;
    }

    // dot product between two vectors
    float vecdot(const float* u, const float* v) const {
        float ans = 0.0;
        for (int i = 0; i < n; i++) ans += u[i] * v[i];
        return ans;
    }

    // multiply by scalar
    void operator*=(float k) {
        for (int i = 0, l = rows.back(); i < l; i++)
            vals[i] *= k;
    }

    // res = mat * src
    void matvecmul(const float* src, float* res) const {
        for (int i = 0; i < n; i++) {
            res[i] = 0.0;
            for (int ji = rows[i]; ji < rows[i + 1]; ji++) {
                res[i] += vals[ji] * src[cols[ji]];
            }
        }
    }

    // res = mat^T * src
    void vecmatmul(const float* src, float* res) const {
        for (int j = 0; j < n; j++)
            res[j] = 0.0;
        for (int i = 0; i < n; i++) {
            for (int ji = rows[i]; ji < rows[i + 1]; ji++) {
                res[cols[ji]] += vals[ji] * src[i];
            }
        }
    }

    // return u^T * mat * v
    float vecmatvecmul(const float* u, const float* v) const {
        float res = 0.0;
        for (int i = 0; i < n; i++) {
            for (int ji = rows[i]; ji < rows[i + 1]; ji++) {
                res += u[i] * vals[ji] * v[cols[ji]];
            }
        }
        return res;
    }

    // solve a lower triangular matrix equation
    void lowerSolve(float* x) const {
        for (int i = 0; i < n; i++) {
            float s = 0.0;
            for (int ji = rows[i]; ji < rows[i + 1] - 1; ji++)
                s += vals[ji] * x[cols[ji]];
            int ji = rows[i + 1] - 1;
            assert(i == cols[ji]);
            x[i] = (x[i] - s) / vals[ji];
        }
    }
    // solve an upper triangular matrix equation
    void upperSolve(float* x) const {
        for (int i = n - 1; i >= 0; i--) {
            float s = 0.0;
            for (int ji = rows[i + 1] - 1; ji > rows[i]; ji--)
                s += vals[ji] * x[cols[ji]];
            int ji = rows[i];
            assert(i == cols[ji]);
            x[i] = (x[i] - s) / vals[ji];
        }
    }

    // evaluate (mat*x-b)^2
    float linequError2(const float* x, const float* b) const {
        float toterr = 0.0;
        for (int i = 0; i < n; i++) {
            float err = -b[i];
            for (int ji = rows[i]; ji < rows[i + 1]; ji++) {
                err += vals[ji] * x[cols[ji]];
            }
            toterr += err * err;
        }
        return toterr;
    }
};


float vecnorm2(int n, const float* r) {
    float s = 0.0;
    for (int i = 0; i < n; i++) s += r[i] * r[i];
    return s;
}
float vecdot(int n, const float* u, const float* v) {
    float s = 0.0;
    for (int i = 0; i < n; i++) s += u[i] * v[i];
    return s;
}

// conjugate gradient from symmetric linear operator
// x must be initialized
// returns the number of iterations
int conjugateGradient(
    int n,
    std::function<void(const float* src, float* res)> A,
    const float* b, float* x, int miniter, int maxiter, float tol
) {
    // r = b - Ax
    float* r = new float[n];
    A(x, r);
    for (int i = 0; i < n; i++) r[i] = b[i] - r[i];
    float r20 = vecnorm2(n, r);
    // p = r
    float* p = new float[n];
    std::memcpy(p, r, n * sizeof(float));
    // loop
    float* Ap = new float[n];
    int k; for (k = 0; k < maxiter; k++) {
        // α = rᵀr / pᵀAp
        A(p, Ap);
        float alpha = r20 / vecdot(n, p, Ap);
        // x = x + αp
        for (int i = 0; i < n; i++) x[i] += alpha * p[i];
        // r = r - αAp
        for (int i = 0; i < n; i++) r[i] -= alpha * Ap[i];
        // β = r₁ᵀr₁ / r₀ᵀr₀
        float r21 = vecnorm2(n, r);
        if ((k > miniter && r21 < tol) || std::isnan(r21)) { k++; break; }
        if (k == miniter) tol = tol*tol*r21;
        float beta = r21 / r20;
        r20 = r21;
        // p = r + βp
        for (int i = 0; i < n; i++) p[i] = r[i] + beta * p[i];
        // verbose
        if (k % 100 == 0) {
            float maxdif = 0.0;
            for (int i = 0; i < n; i++)
                maxdif = fmax(maxdif, fabs(r[i]));
            printf("%d %g\n", k, maxdif);
        }
    }
    delete[] r; delete[] p; delete[] Ap;
    return k;
}

// preconditioned conjugate gradient
int conjugateGradientPreconditioned(
    int n,
    std::function<void(const float* src, float* res)> A,
    std::function<void(const float* src, float* res)> M,
    const float* b, float* x, int miniter, int maxiter, float tol
) {
    // r = b - Ax
    float* r = new float[n];
    A(x, r);
    for (int i = 0; i < n; i++) r[i] = b[i] - r[i];
    // z = M⁻¹ r
    float* z = new float[n];
    M(r, z);
    float rz0 = vecdot(n, r, z);
    // p = r
    float* p = new float[n];
    std::memcpy(p, z, n * sizeof(float));
    // loop
    float* Ap = new float[n];
    int k; for (k = 0; k < maxiter; k++) {
        // α = rᵀz / pᵀAp
        A(p, Ap);
        float alpha = rz0 / vecdot(n, p, Ap);
        // x = x + αp
        for (int i = 0; i < n; i++) x[i] += alpha * p[i];
        // r = r - αAp
        for (int i = 0; i < n; i++) r[i] -= alpha * Ap[i];
        float r2 = vecnorm2(n, r);
        if ((k > miniter && r2 < tol) || std::isnan(r2)) { k++; break; }
        if (k == miniter) tol = tol*tol*r2;
        // z₁ = M⁻¹ r₁
        M(r, z);
        // β = r₁ᵀz₁ / r₀ᵀz₀
        float rz1 = vecdot(n, r, z);
        float beta = rz1 / rz0;
        rz0 = rz1;
        // p = z + βp
        for (int i = 0; i < n; i++) p[i] = z[i] + beta * p[i];
        // verbose
        if (k % 100 == 0) {
            float maxdif = 0.0;
            for (int i = 0; i < n; i++)
                maxdif = fmax(maxdif, fabs(r[i]));
            printf("%d %g\n", k, maxdif);
        }
    }
    delete[] r; delete[] z; delete[] p; delete[] Ap;
    return k;
}