tensorrt-insight/deploy at main · lix19937/tensorrt-insight

History

Name		Name	Last commit message	Last commit date
parent directory ..
from_plan.md		from_plan.md
make_inputs.md		make_inputs.md
nozero2fixedshape.md		nozero2fixedshape.md
onnx-ort.md		onnx-ort.md
readme.md		readme.md
trex.md		trex.md
部署业务需求.md		部署业务需求.md

readme.md

无自定义node 的onnx

# onnx optimize   
python -m onnxsim src.onnx  model_sim.onnx

polygraphy surgeon sanitize --fold-constants input_model.onnx  -o folded_model.onnx

# check two onnx output  
python run_onnxrt.py     

# onnx2plan 评测时间    
trtexec --onnx=model_sim.onnx --fp16 --verbose --saveEngine=model_sim.plan  \
--dumpProfile --dumpLayerInfo --separateProfileRun \
--inputIOFormats=fp16:chw,int32:chw,fp16:chw,fp16:chw,fp16:chw \
--outputIOFormats=fp16:chw \
--noDataTransfers --useCudaGraph --useSpinWait   | tee log


# onnx vs plan   result align     
## fp32  
polygraphy run model_sim.onnx --trt --onnxrt   

## fp16
polygraphy run model_sim.onnx --trt --onnxrt --atol 0.001 --rtol 0.001 --fp16

## fp16 dynamic batch    
polygraphy run model_sim.onnx --trt --onnxrt  --fp16 \
        --trt-min-shapes x:[1,3,224,224]  y:[1,1,1,224] \
        --trt-opt-shapes x:[4,3,224,224]  y:[4,1,1,224] \
        --trt-max-shapes x:[8,3,224,224]  y:[8,1,1,224]

带自定义node的 onnx

带自定义node的onnx 是否可以跳过指定layer ? 或者手动实现 ort op

trtexec --verbose \
--fp16 \
--dumpProfile \
--separateProfileRun \
--loadEngine=bevf-640-1600-48-48_poly.plan \
--plugins=./libplugin_custom.so \
--dumpLayerInfo --profilingVerbosity=detailed --exportLayerInfo=bevf-640-1600-48-48_poly.json \
--useCudaGraph  \
--loadInputs='img':img-6-3-640-1600.bin,'lidar2img':lidar2img-1-6-4-4.bin,'3':prev_bev-1-2304-256.bin \
--exportOutput=bevf-640-1600-48-48_poly_out.json

复杂网络导出 onnx 方法

问题定位
逐步逼近（提前返回）方法

复杂 onnx 导出 plan 方法

问题定位
逐步逼近（提前返回）方法--逐渐导出完整onnx 来进行转换

精度问题

https://github.com/NVIDIA/TensorRT/blob/main/tools/Polygraphy/how-to/debug_accuracy.md

torch 网络每一层输入输出范围

torch 网络每一层权重范围

onnx 模型每一层输入输出范围

onnx 模型每一层权重范围

从build log 中截取roi 信息

(torch113) lix@SHJS-PF4ZKYLL:/mnt/d/workspace/BEVFormer-master-infer-phm/200x200_r50$ awk '/mem_span/{print NR}'  bevf-640-1600-200-200-1_poly-error.log
213141
(torch113) lix@SHJS-PF4ZKYLL:/mnt/d/workspace/BEVFormer-master-infer-phm/200x200_r50$ grep -n "mem_span"  bevf-640-1600-200-200-1_poly-error.log
213141:operand.cpp:61: DCHECK(mem_span <= data_->size()) failed. mem_span: 2559986, data_->size()320000

ref

https://zhuanlan.zhihu.com/p/535021438
https://zhuanlan.zhihu.com/p/436017991

pytorch/pytorch#61277

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

deploy

deploy

readme.md

无自定义node 的onnx

带自定义node的 onnx

复杂网络导出 onnx 方法

复杂 onnx 导出 plan 方法

精度问题

torch 网络每一层输入输出范围

torch 网络每一层权重范围

onnx 模型每一层输入输出范围

onnx 模型每一层权重范围

从build log 中截取roi 信息

ref

Files

deploy

Directory actions

More options

Directory actions

More options

Latest commit

History

deploy

Folders and files

parent directory

readme.md

无自定义node 的onnx

带自定义node的 onnx

复杂网络导出 onnx 方法

复杂 onnx 导出 plan 方法

精度问题

torch 网络每一层输入输出范围

torch 网络每一层权重范围

onnx 模型每一层输入输出范围

onnx 模型每一层权重范围

从build log 中截取roi 信息

ref