简体中文 | English

PaddleRS推理API说明

PaddleRS的动态图推理和静态图推理能力分别由训练器（BaseModel及其子类）和预测器（paddlers.deploy.Predictor）提供。

动态图推理API

整图推理

`BaseChangeDetector.predict()`

接口形式：

def predict(self, img_file, transforms=None):

输入参数：

参数名称	类型	参数说明	默认值
`img_file`	`list[tuple]` \| `tuple[str\|numpy.ndarray]`	输入影像对数据（NumPy数组形式）或输入影像对路径。若仅预测一个影像对，使用一个元组顺序包含第一时相影像数据/路径以及第二时相影像数据/路径。若需要一次性预测一组影像对，以列表包含这些影像对的数据或路径（每个影像对对应列表中的一个元组）。
`transforms`	`paddlers.transforms.Compose` \| `None`	对输入数据应用的数据变换算子。若为`None`，则使用训练器在验证阶段使用的数据变换算子。	`None`

返回格式：

若img_file是一个元组，则返回对象为包含下列键值对的字典：

{"label_map": 输出类别标签（以[h, w]格式排布），"score_map": 模型输出的各类别概率（以[h, w, c]格式排布）}

若img_file是一个列表，则返回对象为与img_file等长的列表，其中的每一项为一个字典（键值对如上所示），顺序对应img_file中的每个元素。

`BaseClassifier.predict()`

接口形式：

def predict(self, img_file, transforms=None):

输入参数：

参数名称	类型	参数说明	默认值
`img_file`	`list[str\|numpy.ndarray]` \| `str` \| `numpy.ndarray`	输入影像数据（NumPy数组形式）或输入影像路径。若需要一次性预测一组影像，以列表包含这些影像的数据或路径（每幅影像对应列表中的一个元素）。
`transforms`	`paddlers.transforms.Compose` \| `None`	对输入数据应用的数据变换算子。若为`None`，则使用训练器在验证阶段使用的数据变换算子。	`None`

返回格式：

若img_file是一个字符串或NumPy数组，则返回对象为包含下列键值对的字典：

{"class_ids_map": 输出类别标签,
 "scores_map": 输出类别概率,
 "label_names_map": 输出类别名称}

若img_file是一个列表，则返回对象为与img_file等长的列表，其中的每一项为一个字典（键值对如上所示），顺序对应img_file中的每个元素。

`BaseDetector.predict()`

接口形式：

def predict(self, img_file, transforms=None):

输入参数：

参数名称	类型	参数说明	默认值
`img_file`	`list[str\|numpy.ndarray]` \| `str` \| `numpy.ndarray`	输入影像数据（NumPy数组形式）或输入影像路径。若需要一次性预测一组影像，以列表包含这些影像的数据或路径（每幅影像对应列表中的一个元素）。
`transforms`	`paddlers.transforms.Compose` \| `None`	对输入数据应用的数据变换算子。若为`None`，则使用训练器在验证阶段使用的数据变换算子。	`None`

返回格式：

若img_file是一个字符串或NumPy数组，则返回对象为一个列表，列表中每个元素对应一个预测的目标框。列表中的元素为包含下列键值对的字典：

{"category_id": 类别ID,
 "category": 类别名称,
 "bbox": 目标框位置信息，对于水平目标框依次包含目标框左上角的横、纵坐标以及目标框的宽度和高度，对于旋转框依次包含目标框的四个角点的横、纵坐标,  
 "score": 类别置信度,
 "mask": [RLE格式](https://baike.baidu.com/item/rle/366352)的掩模图（mask），仅实例分割模型预测结果包含此键值对}

若img_file是一个列表，则返回对象为与img_file等长的列表，其中的每一项为一个由字典（键值对如上所示）构成的列表，顺序对应img_file中的每个元素。

`BaseRestorer.predict()`

接口形式：

def predict(self, img_file, transforms=None):

输入参数：

参数名称	类型	参数说明	默认值
`img_file`	`list[str\|numpy.ndarray]` \| `str` \| `numpy.ndarray`	输入影像数据（NumPy数组形式）或输入影像路径。若需要一次性预测一组影像，以列表包含这些影像的数据或路径（每幅影像对应列表中的一个元素）。
`transforms`	`paddlers.transforms.Compose` \| `None`	对输入数据应用的数据变换算子。若为`None`，则使用训练器在验证阶段使用的数据变换算子。	`None`

返回格式：

若img_file是一个字符串或NumPy数组，则返回对象为包含下列键值对的字典：

{"res_map": 模型输出的复原或重建影像（以[h, w, c]格式排布）}

若img_file是一个列表，则返回对象为与img_file等长的列表，其中的每一项为一个字典（键值对如上所示），顺序对应img_file中的每个元素。

`BaseSegmenter.predict()`

接口形式：

def predict(self, img_file, transforms=None):

输入参数：

参数名称	类型	参数说明	默认值
`img_file`	`list[str\|numpy.ndarray]` \| `str` \| `numpy.ndarray`	输入影像数据（NumPy数组形式）或输入影像路径。若需要一次性预测一组影像，以列表包含这些影像的数据或路径（每幅影像对应列表中的一个元素）。
`transforms`	`paddlers.transforms.Compose` \| `None`	对输入数据应用的数据变换算子。若为`None`，则使用训练器在验证阶段使用的数据变换算子。	`None`

返回格式：

若img_file是一个字符串或NumPy数组，则返回对象为包含下列键值对的字典：

{"label_map": 输出类别标签（以[h, w]格式排布），"score_map": 模型输出的各类别概率（以[h, w, c]格式排布）}

若img_file是一个列表，则返回对象为与img_file等长的列表，其中的每一项为一个字典（键值对如上所示），顺序对应img_file中的每个元素。

滑窗推理

考虑到遥感影像的大幅面性质，PaddleRS为部分任务提供了滑窗推理支持。PaddleRS的滑窗推理功能具有如下特色：

为了解决一次读入整张大图直接导致内存不足的问题，PaddleRS采用延迟载入内存的技术，一次仅读取并处理一个窗口内的影像块。
用户可自定义滑窗的大小和步长。支持滑窗重叠，对于窗口之间重叠的部分，PaddleRS将自动对模型预测结果进行融合。
支持将推理结果保存为GeoTiff格式，支持对地理变换信息、地理投影信息的读取与写入。

目前，图像分割训练器（BaseSegmenter及其子类）与变化检测训练器（BaseChangeDetector及其子类）具有动态图滑窗推理API，以图像分割任务的API为例，说明如下：

接口形式：

def slider_predict(self,
                   img_file,
                   save_dir,
                   block_size,
                   overlap=36,
                   transforms=None,
                   invalid_value=255,
                   merge_strategy='keep_last',
                   batch_size=1,
                   eager_load=False,
                   quiet=False):

输入参数列表：

参数名称	类型	参数说明	默认值
`img_file`	`str`	输入影像路径。
`save_dir`	`str`	预测结果输出路径。
`block_size`	`list[int]` \| `tuple[int]` \| `int`	滑窗的窗口大小（以列表或元组指定宽度、高度或以一个整数指定相同的宽高）。
`overlap`	`list[int]` \| `tuple[int]` \| `int`	相邻滑窗的重叠像素数（以列表或元组指定宽度、高度或以一个整数指定相同的宽高）。	`36`
`transforms`	`paddlers.transforms.Compose` \| `None`	对输入数据应用的数据变换算子。若为`None`，则使用训练器在验证阶段使用的数据变换算子。	`None`
`invalid_value`	`int`	输出影像中用于标记无效像素的数值。	`255`
`merge_strategy`	`str`	合并滑窗重叠区域使用的策略。`'keep_first'`表示保留遍历顺序（从左至右，从上往下，列优先）最靠前的窗口的预测类别；`'keep_last'`表示保留遍历顺序最靠后的窗口的预测类别；`'accum'`表示通过将各窗口在重叠区域给出的预测概率累加，计算最终预测类别。需要注意的是，在对大尺寸影像进行`overlap`较大的密集推理时，使用`'accum'`策略可能导致较长的推理时间，但一般能够在窗口交界部分取得更好的表现。	`'keep_last'`
`batch_size`	`int`	预测时使用的mini-batch大小。	`1`
`eager_load`	`bool`	若为`True`，则不使用延迟内存载入，而是在预测开始时一次性将整幅影像载入到内存。	`False`
`quiet`	`bool`	若为`True`，不显示预测进度。	`False`

变化检测任务的滑窗推理API与图像分割任务类似，但需要注意的是输出结果中存储的地理变换、投影等信息以从第一时相影像中读取的信息为准，存储滑窗推理结果的文件名也与第一时相影像文件相同。

静态图推理API

Python API

将模型导出为部署格式或执行模型量化后，PaddleRS提供paddlers.deploy.Predictor用于加载部署或量化格式模型以及执行基于Paddle Inference的推理。

初始化`Predictor`对象

Predictor.__init__()接受如下参数：

参数名称	类型	参数说明	默认值
`model_dir`	`str`	模型路径（必须是导出的部署或量化模型）。
`use_gpu`	`bool`	是否使用GPU。	`False`
`gpu_id`	`int`	使用GPU的ID。	`0`
`cpu_thread_num`	`int`	使用CPU执行推理时的线程数。	`1`
`use_mkl`	`bool`	是否使用MKL-DNN计算库（此选项仅在使用CPU执行推理时生效）。	`False`
`mkl_thread_num`	`int`	MKL-DNN计算线程数。	`4`
`use_trt`	`bool`	是否使用TensorRT。	`False`
`use_glog`	`bool`	是否启用glog日志。	`False`
`memory_optimize`	`bool`	是否启用内存优化。	`True`
`max_trt_batch_size`	`int`	在使用TensorRT时配置的最大batch size。	`1`
`trt_precision_mode`	`str`	在使用TensorRT时采用的精度，可选值为`'float32'`或`'float16'`。	`'float32'`

`Predictor.predict()`

接口形式：

def predict(self,
            img_file,
            topk=1,
            transforms=None,
            warmup_iters=0,
            repeats=1):

输入参数列表：

参数名称	类型	参数说明	默认值
`img_file`	`list[str\|tuple\|numpy.ndarray]` \| `str` \| `tuple` \| `numpy.ndarray`	对于场景分类、目标检测、图像复原和图像分割任务来说，该参数可为单一图像路径，或是解码后的、排列格式为[h, w, c]且具有float32类型的图像数据（表示为NumPy数组形式），或者是一组图像路径或`numpy.ndarray`对象构成的列表；对于变化检测任务来说，该参数可以为图像路径二元组（分别表示前后两个时相影像路径），或是解码后的两幅图像组成的二元组，或者是上述两种二元组之一构成的列表。
`topk`	`int`	场景分类模型预测时使用，表示选取模型输出概率大小排名前`topk`的类别作为最终结果。	`1`
`transforms`	`paddlers.transforms.Compose`\|`None`	对输入数据应用的数据变换算子。若为`None`，则使用从`model.yml`中读取的算子。	`None`
`warmup_iters`	`int`	预热轮数，用于评估模型推理以及前后处理速度。若大于`1`，将预先重复执行`warmup_iters`次推理，而后才开始正式的预测及其速度评估。	`0`
`repeats`	`int`	重复次数，用于评估模型推理以及前后处理速度。若大于`1`，将执行`repeats`次预测并取时间平均值。	`1`
`quiet`	`bool`	若为`True`，不打印计时信息。	`False`

Predictor.predict()的返回格式与相应的动态图推理API的返回格式完全相同，详情请参考动态图推理API。

`Predictor.slider_predict()`

实现滑窗推理功能。用法与BaseSegmenter和BaseChangeDetector的slider_predict()方法相同。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

infer_cn.md

infer_cn.md

PaddleRS推理API说明

动态图推理API

整图推理

`BaseChangeDetector.predict()`

`BaseClassifier.predict()`

`BaseDetector.predict()`

`BaseRestorer.predict()`

`BaseSegmenter.predict()`

滑窗推理

静态图推理API

Python API

初始化`Predictor`对象

`Predictor.predict()`

`Predictor.slider_predict()`

Files

infer_cn.md

Latest commit

History

infer_cn.md

File metadata and controls

PaddleRS推理API说明

动态图推理API

整图推理

BaseChangeDetector.predict()

BaseClassifier.predict()

BaseDetector.predict()

BaseRestorer.predict()

BaseSegmenter.predict()

滑窗推理

静态图推理API

Python API

初始化Predictor对象

Predictor.predict()

Predictor.slider_predict()

`BaseChangeDetector.predict()`

`BaseClassifier.predict()`

`BaseDetector.predict()`

`BaseRestorer.predict()`

`BaseSegmenter.predict()`

初始化`Predictor`对象

`Predictor.predict()`

`Predictor.slider_predict()`