fastai-notes

fastai part1 & part2 notes, part1的中文笔记来自其他作者对hiromis笔记的翻译，part2的中文笔记为英文笔记翻译而成

fastai part1 notes

https://github.com/hiromis/notes 参考hiromis的笔记，有中文版，质量较高。
- chinese文件夹，来源于https://github.com/hiromis/notes
lesson1.pdf - lesson2.pdf
lesson3.pdf - lesson4.pdf
lesson5.pdf - lesson6.pdf
lesson7.pdf - lesson8.pdf
lesson9.pdf - lesson10.pdf
lesson11.pdf - lesson12.pdf - lesson12.pdf详细

fastai part2 notes

lesson8 markdown 笔记源文件： lesson8 中文版笔记 md版本 lesson8.pdf fastai 2019 lesson8 notes 笔记_hello world-CSDN博客
lesson9 markdown ：lesson9 中文版笔记 md版本 lesson9.pdf
lessson10 markdown: lesson10 中文版笔记 md版本 lesson10.pdf
lessson11 markdown: lesson11 中文版笔记 md版本 lesson11.pdf
lesson12 markdown: lesson12 中文版笔记 md版本 lesson12.pdf详细

每日更新

❌UnDo ✔️Done ⭕ToDo

2023年8月15日星期二

找到了Radek的twitter的正确访问姿势：from:radekosmulski since:2017-09-30 until:2017-10-30
然后开始复制他之前的Keras笔记本，安装keras环境，运行笔记本，然后获得一些insight
pip install tensorflow 安装tensorflow会自动安装keras的，他两是绑定在一起的。以及keras-prepocessing会安装很多依赖的。
根本不需要去做Keras（colab运行的keras代码），然后只要重写为pytorch代码即可。

2023年8月8日星期二

整整2个月没有回来了，大概说一下这两个月我在干什么！

首先从023年6月8日的RetinaNet开始，因为不清楚网络结构，就去CSDN上搜索了下RetinaNet的网络结构介绍，主要是为了找一个网络结构图。
结果一个THU的RetinaNet的博文推荐了吴喆的bilibili，这个视频合集和他的仓库吴喆的深度学习代码仓库，我从目标检测篇开始看的，然后开始下载数据集去运行他的代码，因为很容易有一个baseline作为基础。
从此一发不可收。从FasterRCNN到YOLOv3-spp，一路浩浩荡荡的看完。对目标检测的代码实现、运行结果，都可以有一个直观的感受。
由于之前快一年的时间，都困在了mAP的计算里面。这里吴喆采用了pycocotool，我就下载了源码，然后开始debug，对mAP有了一个完整正确的认识！从mAP开始，理论开始真正和代码结合起来理解。这过去的一年时间，感觉都是弯路了！
吴喆的代码：从nvidia和Pytorch等官网的代码借鉴过来，然后实现。然后主干网络都换成了更成熟的网络，backbone都换成了resnet50，而不是原论文的原始实现。这才能更适合当前阶段的学习！！！而且代码简洁，简单，没有复杂的库的调用，原始。更容易成为baseline；更容易在上面添加和修改；
再加上之前fastai的基础，可以在ipynb上做修改，留记录等操作！
看完了目标检测的系列视频，运行完了faster rcnn, ssd, yolov3-spp, RetinaNet等四个网络后，对目标检测的理解不一样了。
然后开始在自己的数据集上训练，发现了热力图问题，开始要解决问题。
就需要对模型进行诊断，需要用到fastai课程提到的激活元均值和方差，需要统计直方图等概念，这次是要自己在Pytorch的基础上写诊断网络；同时可以在吴喆的目标检测网络上验证fastai课程的BN等trick，初始化等trick，带来的变化；从简单到复杂，一步一步，似乎看到了代码的希望。
总结一下：一个代码伟人的肩膀来垫一垫，真的太重要了，我寻寻觅觅了那么久，最后找到这样一个肩膀，太不容易了。要么找，要么自己做！！！
从我的经历来看：学习的突破都在找到了关键代码开始的！！寻找代码的过程占据了我大部分的时间，比如1年，且最后都是在很意外和偶然的情况下发现并找到的！！！
①说明我不知道我需要的是什么！经过第一次的科研训练，我应该很清楚的知道我需要的是一个源代码作为起点，为什么我在这一次的深度学习之旅没有重视到这一点？
②这一次我没有刻意去找，甚至放弃了pytorch的源码；想要找一个啥都可以干的框架，这是错误的；fastai的框架虽然好用，但是还是复杂了。还是应该大道至简，自己整最简单的，然后去尝试技巧。
③最后靠意外发现，然后尝试，然后发现很适合自己；这个铺垫的路子太长了，找方向太艰难了。为什么这一路我没有总结到这一点？为什么一直没有找到努力最大的方向？只有找到了，体验了，才知道，哇，这才是我需要的？
还是说市场上之前一直没有这类型的代码仓库？那别人建立了，是别人的优秀，那么就需要向优秀的人学习，他们的学习方法和学习策略，你看是向代码仓库，向官方，向更优秀的代码资源open，然后来改写。
需要学习的太多了，请向优秀的人学习！

2023年6月9日星期五

aeroplane dets:2 gts:102 实际大小：600个；所以这里的gts里面就有问题了。

2023年6月8日星期四

看retinaNet，为什么效果和ssd有差异呢？怎么比较？
RetinaNet 2017 ICCV

RetinaNet是继SSD和YOLO V2公布后，YOLO V3诞生前的一款目标检测模型，出自何恺明大神的《Focal Loss for Dense Object Detection》。全文针对现有单阶段法（one-stage)目标检测模型中前景(positive)和背景(negatives)类别的不平衡问题，提出了一种叫做Focal Loss的损失函数，用来降低大量easy negatives在标准交叉熵中所占权重（提高hard negatives所占权重)。为了检测提出的Focal Loss损失函数的有效性，所以作者就顺便提出了一种简单的模型RetinaNet。（所以RetinaNet不是本篇论文的主角，仅仅是附属物了呗？）

2023年6月7日星期三

继续探索自上而下的路线的可行性：需要对icevision有一个深入的认识。从数据集->model->callback->map 等，都有一个清晰的认识，从认识库的源码开始！！
- 写笔记，然后回来论证这条道路的可行性！！
- 目标：（1）我如何在这之上，写自己的代码？（2）如何做我的baseline？（3）如何添砖加瓦？（4）如何保证代码正确？（5）如何判断路线的可行性？
- icevision详细笔记：
由于v5太复杂了，所以还是用最简单的来看一下

2023年6月1日星期四

mAP的计算说明：①非VOC_2007，daveluo的mAP代码；
VOC07_mAP：文件list的mAP；RetinaNet fastai1的代码；focal loss的代码都是这种。
坑一：valid太少，只有2个batch,0.02; 但是Loss在持续下降，说明网络训练的没问题；但是看到batch的个数就不对了，说明valid的数据量少了，所以AP就没用了；增加数据量
RetinaNet Christian的代码：先用了0.3的

2023年5月31日星期三

凌乱了，文件mAP和nms_score_thresh_mAP两个整凌乱了；讲道理都应该是pr曲线的阈值是那啥，怎么能是文件mAP呢
RetinaNet fastai1的nb学习，下载了cocosample的数据集，学习其内容
感触比较大的是：anchor很多，anchor和gt-box的情况，可视化，可以发现VOC数据集，在189个锚框的时候，能框住的目标真的很少，这会导致怎样的问题？
https://github.com/ChristianMarzahl/ObjectDetection/tree/master 这个代码中的mAP计算，是scores的阈值为0.3，然后计算这个下面的precision和recall，只有一个pr值，相当于；计算样本的pr曲线感觉不太对劲哦，应该是里面的固定scores阈值后，变化iou阈值？或者反着来的mAP值，才是对的；怎么回事对样本的pr曲线呢，这个有啥意义呢？
和之前的mAP计算代码差距太大，必须加以对比。
之前的mAP计算逻辑如下：
- （1）nms_scores_thresh=0.05 ---> nms， nms_iou_thresh=0.5
- （2）tps[k,c] k为置信度阈值；c为某个类别； fps[k,c], fns[k,c]

Hi @ChristianMarzahl , thank you for your work. It was helpful for me, especially anchors representations. I adapted your code to fastai2, feel free to use it https://colab.research.google.com/drive/1ZA6yWj8wHwKUj3HT_LK3rsKYUPIkwnzZ Once I get good results I'll update this repo https://github.com/manycoding/signatures-detection with the V2 code.

v2 code of this repo, 值得一看

https://github.com/ChristianMarzahl/ObjectDetection/tree/master
https://github.com/wushuang01/Focal_loss_for_object_detection RetinaNet focal loss voc2007 mAP 69% 这个mAP也是通过文件List来计算的，跟retinanet那个是一模一样的
longcw/yolo2-pytorch#23 中 https://github.com/cory8249/yolo2-pytorch/tree/master cory8249在上面的基础上获得了 71%的VOC mAP
https://nbviewer.org/gist/daveluo/2ab83da32e623864e543d7251e9beef4 详细的MAP计算

daveluo参考了Sylvain Gugger的代码，Sylvain的mAP代码地址为： https://github.com/sgugger/Deep-Learning/blob/master/mAP/Computing%20the%20mAP%20metric.ipynb fastai 论坛的讨论地址为： http://forums.fast.ai/t/mean-average-precision-map/14345

———————————————— 版权声明：本文为CSDN博主「_helen_520」的原创文章，遵循CC 4.0 BY-SA版权协议，转载请附上原文出处链接及本声明。原文链接： https://blog.csdn.net/haronchou/article/details/127976769

我用4的代码，进行的mAP计算：voc07 ssd_fastai 189anchor， mAP=0.45 https://github.com/HaronCHou/fastai-notes/blob/main/SSD_mAP.ipynb

2023年5月29日星期一

上周五看到两个好的代码：①yolov3的pytorch源码，我已经可以完全看懂了；需要尝试，并了解其中的一些loss，等差别；mAP等；关键在于mAP的计算是怎样的
VOC2007_mAP在yolov v2的时候也不太高；v3也不太高；
RetinaNet fastai1，有比较好的metric，仔细阅读其代码，然后，看能否在这个基础上优化，做有意义的测试。https://github.com/ChristianMarzahl/ObjectDetection/tree/master fastai1 有详细的metric debug代码，并复用
https://github.com/wushuang01/Focal_loss_for_object_detection RetinaNet focal loss voc2007 mAP 69%
https://github.com/longcw/yolo2-pytorch/tree/master yolov2 pytorch 没有mAP方面的说明
longcw/yolo2-pytorch#23 中https://github.com/cory8249/yolo2-pytorch/tree/master cory8249在上面的基础上获得了 71%的VOC mAP

2023年5月26日14:50:11 周五

yolov3去使用voc数据集，并计算voc2007的mAP

# yolov3唐宇迪代码环境配置：在fastai1的环境上安装tensorflow
pip install --index-url https://pypi.douban.com/simple tensorflow
or
pip install --index-url http://mirrors.aliyun.com/pypi/simple/ tensorflow

2023年5月25日15:55:38 周四

仔细阅读了yolov3的源码和唐宇迪的注释；环境为：A100, root环境下，zhr_fastai1的环境；代码也在root环境下；数据集是coco数据集。
心得：这个loss里面最大的组成是置信度loss，这个挺奇怪的；有目标的和没目标的，这个loss的计算极其奇怪；v2和v3的loss组成是一毛一样的。
yolov3跑VOC2007数据集试一下，看一下mAP的结果，现在是两边的mAP定义不一样，不知道Yolov3的是不是coco map；要区分一下结果。才能有一个一直的认识
https://pjreddie.com/darknet/yolo/ yolo跑VOC数据集的demo在此处
还有Yolov2的源码使用的VOC mAP，可以去看下源码的实现

2023年5月24日09:43:07 周三

clas类别概率图可视化：意义很大；
特征提取hooks，可视化，意义也比较大；至少也是指示anchor的类别；
①骨干网络特征提取图可视化；②类别概率图可视化，两者结合更能体现出骨干网络和检测头的价值

2023年5月23日14:52:09

精读Radek的《menta Learning》

建立baseline，然后阅读paper（正确的方法阅读），验证是否对自己的任务有用；读论文，复现，看结果，分析是否work？

每天都一点点改进，让自己的模型表现更好

不要单纯调参去运行实验，改进网络更重要。

要写Debug代码来帮助诊断和分析模型，理解模型到底在干什么，是不是work？

读yolo的paper，并看涨点多的地方，去改进SSD，看看效果怎么样？
读以前写得《目标检测.docx》的文档，温故而知新！看到voc2007数据集的目标数量，再看训练结果，一起分析。
VOC mAP和COCO mAP的差异，控制的自变量不一样。来源：https://blog.csdn.net/c2250645962/article/details/106476147

2023年5月18日10:36:57

focal_loss和bce_loss的差异在哪里体现？ softmax在哪里体现？
bce_loss里面也是要自己实现softmax的自己实现的
很详细的focal loss的介绍
- 既然focal loss对分类任务影响较大，可以在分类任务上尝试，看看focal loss对acc的影响有多大，同样的数据，同样的epoch来做一个参考和说明
- 在pets的数据集上看下效果。
- 测试后，发现4个epoch并不能看到太多；同时一定要Lr_find看下合适的学习率是多少；loss_func竟然可以自定义；关键在于里面没有One_hot_embedding，pets数据集没有自定义做这一步
- 测试三个loss后发现，没啥变化，在pets上。讲道理focal loss要优秀一些；结论是：数据集太完美了，不存在不平衡，只要有一个类别是不平衡的话，应该就可以看到效果，所以下一步是制造不平衡的数据集，然后看下效果。
- 2023年5月23日10:59:28 补充：focal loss在分类问题上，对loss的改变，差别不大；但是在目标检测任务中，由于anchor是189个，数量较多；一个epoch下来，loss的改变是比较大的；focal loss的绝对值比BCE loss低了10倍多左右，绝对值差异；但是对于map的结果影响不大，还是0.35左右的mAP，所以在ssd网络中，要提升mAP的话，loss可能不是最重要的，还要寻找优化点最高的地方！！！🌟🌟🌟🌟🌟

将其中一个类别从200张图，减少90张后；差异笔记本为pet.ipynb

2023年5月17日 ToDo

如何打造高质量的深度学习数据集？
之前使用的是BCE_loss，改为focal_loss，试一下loss下降的情况，然后，再看下训练完成后mAP有怎样的变化呢？
- 之前使用的就已经是focal_loss了，改为bce_loss回去看看
- 同时为了分析label_loss和bbox_loss，参考https://github.com/HaronCHou/fastai-notes/blob/main/SSD_mAP.ipynb 里面的做法，把label_loss和bbox_loss分别显示
- bce_loss和focal_loss差别如下所示：
与focal loss相比，loss的值增加了很多。应该是anchor box 189个比较大。189bs所有的，累积下来，focal loss得比重就降低了很多。
focal loss在类别不平衡问题面前是很有效的，以及在易区分的物体上降低了一些难度大
对于目标检测而言，anchor189个太多，是一个典型的类别不平衡问题，所以加了focal loss后，效果好很多！
- 再对照Jeremy之前的内容看一下效果，看看改为focal_loss之后的收益到底有多大？
- 还有Yolov5的效果为什么好那么多，CoCo_map都到了90%多了，why?指标不一样？还是网络真的有那么大的改善？结论和答案是什么？icevision的yolov5的v0c2007，效果好太多了，我都不知道为啥？
- 自动驾驶qq群，有关slam的JD，以及一些行业交流，这方面也需要更open的来了解这写行业；极氪36有行业发展、分析、咨询类的文章，观点认识，需要认识整个行业，并开拓视野。
- 『背后的利益是指挥棒』，前端是表象/现象，不是本质的运行逻辑。（遇到困惑需要上升一个维度来思考）
- zeku解散，突然裁员，2000员工；达摩院自动驾驶100人并入菜鸟，裁员200，70%；再看校招薪水的公众号，全球自动驾驶缩水。（不知道结论可不可靠，需要再次多方证实）。并入菜鸟，说明赛道选的是送快递，有局限的应用领域。同时，变现能力在紧缩时代很重要。热钱。『问了几个人，大哥：熬过冬天，适合囤积；chenyang；自动驾驶群看到高仙机器人的深度学习总监，在开课，卖课。单位和买课结合；联想很多人进入AI培训领域赚热钱，怎么个想法』

2023年5月16日09:20:11 周二

✔️成功的经验：mAP计算的每一步要像Jeremy的pascal_muliti.ipynb那样一步步的去走；当时只是运行了Jeremy的笔记本，但是没有自己尝试去复制，所以不知道啥意思。这个很重要。『自己从头制作笔记本，并且不要作弊』，在Jeremy的课程中也有强调这一点。
由于SSD训练的效果不太好，所以一开始就计算mAP意义不太大。反而是训练的差不多的时候再来计算mAP比较有意义。然后再自己去微调。
学习深度碎片：https://github.com/EmbraceLife/My_Journey_on_Kaggle
wasimlorgat在fastai twitter为：wasimlorgat
博客位置：https://wasimlorgat.com/
笔记位置：wasimlorgat学习笔记

遇到困难，不要放弃；分解为更简单的任务来增强技能，并稍后再回来！——这个真的超级有用

✔️完成ssd fastaiv2 + mAP.ipynb
- ✔️其中，mAP还是总的计算，速度还可以的，很快，可能在于batched_nms的函数替换，效果很快；里面也有很多验证性代码，过程值得学习
- ✔️mAP只到 0.3671，还很小；且由于统计规律，10%的小框框根本就无法输出见笔记本的统计结果 https://github.com/HaronCHou/fastai-notes/blob/main/SSD_Object_Detection.ipynb

2023年5月11日11:46:41

看到深度碎片的github和twitter
2023年5月11日16:52:50 在daniel的推荐下，再次去看了Radek的《mata learning》，很神奇的只花了三个小时就完成了，翻译为中文的笔记见：meata learning 中文翻译 How To Learn Deep Learning And Thrive In The Digital Age
看到icevision在Fastai上的内容；看到muller在推荐使用icevision做object detection，更新了blogicevision相关笔记
多学习和记录

以下是深度碎片的原文：

Name		Name	Last commit message	Last commit date
Latest commit History 117 Commits
chinese		chinese
lesson0 2020		lesson0 2020
lesson10		lesson10
lesson11		lesson11
lesson12		lesson12
lesson8		lesson8
lesson9		lesson9
2021-10-29_15-53.png		2021-10-29_15-53.png
2021-10-29_15-58.png		2021-10-29_15-58.png
2021-10-29_16-06.png		2021-10-29_16-06.png
C++ notes.md		C++ notes.md
Lesson 12 Notes Advanced training techniques; ULMFiT from scratch.pdf		Lesson 12 Notes Advanced training techniques; ULMFiT from scratch.pdf
Lesson1.pdf		Lesson1.pdf
Lesson2.pdf		Lesson2.pdf
Lesson3.pdf		Lesson3.pdf
Lesson4.pdf		Lesson4.pdf
Lesson5.pdf		Lesson5.pdf
Lesson6.pdf		Lesson6.pdf
Lesson7.pdf		Lesson7.pdf
README.md		README.md
SSD_Object_Detection.ipynb		SSD_Object_Detection.ipynb
SSD_jav.ipynb		SSD_jav.ipynb
SSD_mAP.ipynb		SSD_mAP.ipynb
Snipaste_2021-10-08_10-42-16.png		Snipaste_2021-10-08_10-42-16.png
Snipaste_2021-10-08_11-01-59.png		Snipaste_2021-10-08_11-01-59.png
Snipaste_2021-10-08_11-02-48.png		Snipaste_2021-10-08_11-02-48.png
export的代码块.py		export的代码块.py
fastai code 实践.md		fastai code 实践.md
fastai code.md		fastai code.md
icevisionNote.md		icevisionNote.md
lesson10.pdf		lesson10.pdf
lesson11.pdf		lesson11.pdf
lesson12 网络笔记.pdf		lesson12 网络笔记.pdf
lesson8.pdf		lesson8.pdf
lesson9.pdf		lesson9.pdf
pets.ipynb		pets.ipynb
train-catdog.ipynb		train-catdog.ipynb
wasimlorgat.md		wasimlorgat.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

fastai-notes

fastai part1 notes

fastai part2 notes

每日更新

2023年8月15日星期二

2023年8月8日星期二

2023年6月9日星期五

2023年6月8日星期四

2023年6月7日星期三

2023年6月1日星期四

2023年5月31日星期三

2023年5月29日星期一

2023年5月26日14:50:11 周五

2023年5月25日15:55:38 周四

2023年5月24日09:43:07 周三

2023年5月23日14:52:09

2023年5月18日10:36:57

2023年5月17日 ToDo

2023年5月16日09:20:11 周二

2023年5月11日11:46:41

About

Releases

Packages

Languages

HaronCHou/fastai-notes

Folders and files

Latest commit

History

Repository files navigation

fastai-notes

fastai part1 notes

fastai part2 notes

每日更新

2023年8月15日 星期二

2023年8月8日 星期二

2023年6月9日 星期五

2023年6月8日 星期四

2023年6月7日 星期三

2023年6月1日 星期四

2023年5月31日 星期三

2023年5月29日 星期一

2023年5月26日14:50:11 周五

2023年5月25日15:55:38 周四

2023年5月24日09:43:07 周三

2023年5月23日14:52:09

2023年5月18日10:36:57

2023年5月17日 ToDo

2023年5月16日09:20:11 周二

2023年5月11日11:46:41

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

2023年8月15日星期二

2023年8月8日星期二

2023年6月9日星期五

2023年6月8日星期四

2023年6月7日星期三

2023年6月1日星期四

2023年5月31日星期三

2023年5月29日星期一

Packages