-
- 第 0 章 计算机视觉概述
-
- 第 1 章 神经网络
- 第 2 章 卷积神经网络
- 2.1 卷积神经网络
- 2.2 实战项目 2 - 动手搭建一个卷积神经网络
- 小结
- 练习
- 参考文献
- 第 3 章 图像分类
- 3.1 数据驱动方法
- 3.1.1 语义上的差别
- 3.1.2 图像分类任务面临着许多挑战
- 3.1.3 数据驱动的方法
- 3.2 k 最近邻算法
- 3.3 支持向量机
- 3.4 逻辑回归 LR
- 3.5 实战项目 3 - 表情识别
- 3.6 实战项目 4 - 使用卷积神经网络对CIFAR10图片进行分类
- 小结
- 练习
- 参考文献
- 3.1 数据驱动方法
- 第 4 章 循环神经网络
- 第 5 章 图神经网络
- 第 6 章 模型选择、欠拟合和过拟合
- 6.1 训练误差和泛化误差
- 6.2 模型选择
- 6.3 欠拟合和过拟合
- 6.4 多项式函数拟合实验
- 6.5 如何应对模型过拟合问题
- 6.5.1 权重衰减
- 6.5.2 丢弃法
- 6.6 数值稳定性和模型初始化
- 小结
- 练习
- 参考文献
- 第 7 章 模型拟合与优化算法
-
- 第 8 章 软件环境搭建与工具使用
- 第 9 章 经典卷积神经网络架构:原理与PyTorch实现
- 第 10 章 著名数据集及基准
- 第 11 章 检测与分割实战项目
- 11.1 语义分割
- 11.1.1 语义分割 PyTorch 版
- 11.1.2 实战项目 8 - 基于PolarNet的点云端到端语义分割项目实战
- 11.2 目标检测
- 11.2.1 常用网络
- 11.2.2 实战项目 9 - 基于PyTorch的YOLO5目标检测项目实战
- 11.3 实例分割
- 小结
- 练习
- 参考文献
- 11.1 语义分割
- 第 12 章 计算机视觉课题研究初探
- 12.1 手写字识别
- 12.2 文本检测
- 12.3 车道线检测
- 12.3.1 常用网络
- 12.3.2 实战项目 11 - 车道线检测项目实战
- 12.4 镜面检测
- 12.5 图像抠图 Matting
- 12.6 图像超分辨率
- 12.7 3D 重建
- 小结
- 练习
- 参考文献
-
-
- 13.1 特征可视化
- 13.2 倒置
- 13.3 可视化数据梯度
- 13.4 Embeddings
- 13.5 对抗样本
- 13.6 DeepDream 和风格迁移
- 13.7 实战项目 12 - PyTorch 如何使用TensorBoard
- 小结
- 练习
- 参考文献
-
- 14.1 Pixel RNN/CNN
- 14.2 自编码器 Auto-encoder
- 14.3 生成对抗网络 GAN
- 14.3.1 概述
- 14.3.2 GAN的基本思想
- 14.3.3 GAN浅析
- 14.3.4 训练相关理论基础
- 14.3.5 项目实战案例StyleGAN
- 14.3.6 实战项目 11 - 图像风格迁移
- 14.4 变分自编码器 Variational Auto-encoder, VAE
- 小结
- 练习
- 参考文献
-
- 15.1 引言-如何解决通用人工智能的难点
- 15.2 什么是深度增强学习
- 15.2.1 深度学习
- 15.2.2 增强学习
- 15.2.3 二者的融合
- 15.3 怎么利用深度增强学习解决问题
- 15.3.1 Policy-based DRL
- 15.3.2 Value-based DRL
- 15.3.3 Model-based DRL
- 15.4 深度增强学习在计算机视觉中的应用
- 小结
- 练习
- 参考文献
-
第 18 章 计算机视觉中的注意力机制 Attention is All You Need
- 18.1 概述
- 18.2 Attention with RNNs
- 18.3 Self-attention 自注意力
- 18.4 软注意力(soft-attention)
- 18.4.1 空间域注意力
- 18.4.2 通道注意力
- 18.4.3 Positional encoding
- 18.4.4 混合域模型
- 18.4.5 Masked attention
- 18.4.6 Multi-head attention
- 18.5 强注意力(hard attention)
- 18.6 Attention九层塔 - 注意力机制的九重理解
- 小结
- 练习
- 参考文献
-
- 20.1 概要
- 20.2 KD主要方法
- 20.2.1 Logits(Response)-based Knowledge
- 20.2.2 Feature-based Knowledge
- 20.2.3 Relation-based Knowledge
- 20.3 知识蒸馏的应用 NLP-BERT
- 20.4 常见疑问解答
- 实战项目 18 - 支付宝CVPR细粒度视觉分类挑战赛夺冠方案解读
- 小结
- 练习
- 参考文献
-
- 21.1 从Mini-Batch SGD说起
- 21.2 Normalization到底是在做什么
- 21.3 Batch Normalization如何做
- 21.3.1 前向神经网络中的BN
- 21.3.2 CNN网络中的BN
- 21.3.3 Batch Norm的四大罪状
- 21.4 三种 Normalization
- 21.4.1 Layer Normalization
- 21.4.2 Instance Normalization
- 21.4.3 Group Normalization
- 21.4.4 用一个故事来总结
- 21.5 Normalization操作的Re-Scaling不变性
- 21.6 Batch Normalization为何有效
- 小结
- 练习
- 参考文献
-
- 22.1 概述
- 22.2 模型压缩
- 22.2.1 线性或非线性量化(1990~2014 - 至今)
- 22.2.2 结构或非结构剪枝(1989~2014 - 至今
- 22.2.3 网络结构搜索(2016 - 至今)
- 22.2.4 权重矩阵的低秩分解()
- 22.2.5 知识蒸馏(2014-至今)
- 22.3 模型优化加速
- 22.3.1 Op-Level 的快速算法
- 22.3.2 Layer0-level 的快速算法
- 22.3.3 硬件计算单元优化算法
- 22.3.3.1 CPU、GPU 和 NPU
- 22.3.3.2 ASIC 和 FPGA
- 22.3.3.3 PIM(NDP)
- 22.4 优化工具与库
- 22.4.1 TensorRT Nvidia)
- 22.4.2 TVM (Tensor Virtual Machine)
- 22.4.3 Tensor Comprehension (Facebook)
- 22.4.4 Distiller (Intel)
- 小结
- 练习
- 参考文献
-
-
-
-
-
-
更新中 ...
-