更新时间:2021-03-18 GMT+08:00
分享

pooling2d

功能说明

通过不同的池化方式,对tensor_in上不同的滑动窗口进行信号的采样。

池化方式支持MAX、AVG、GMP、GAP四种:

  • MAX:max pooling 是取每个滑动窗口覆盖的元素的最大值作为计算输出。
  • AVG:avg pooling是取每个滑动窗口覆盖的元素的和除以窗口面积取平均值后作为输出。
  • GMP:global max pooling 是 max pooling 的特殊模式,即 window 的大小和 feature map 的大小一致的 max pooling
  • GAP:global avg pooling 是 avg pooling 的特殊模式,即 window 的大小和 feature map 的大小一致的 avg pooling

如下图,tensor_in按照pooling_mode为MAX、padding_mode为SAME时池化结果。

q

其中:

  • input_w:tensor_in的W。
  • input_h:tensor_in的H。
  • kernel_w:window的W
  • kernel_h:window的H
  • pad_top:tensor_in的H方向顶部的pad行数,图示中此值为1
  • pad_bottom:tensor_in的H方向底部的pad行数,图示中此值为1
  • pad_left:tensor_in的W方向上左边的pad列数,图示中此值为1
  • pad_right:tensor_in的W方向行右边的pad列数,图示中此值为1
  • stride_w:stride的W
  • stride_h:stride的H

您可以在ATC安装目录下的“python/site-packages/te/te/lang/cce/te_compute/pooling2d_compute.py”查看接口定义。

该接口支持pooling的基本功能及出口量化功能,量化功能默认关闭,若需开启量化功能,按量化算法要求传值配置好quantize_params即可,具体配置方法参见参数说明。

约束说明

此接口暂不支持与其他TBE DSL接口混合使用。

  • 支持的输入数据类型:float16。
  • 输入的tensor_in必须是五维,即符合5D-NC1HWC0格式排布的tensor。
  • 输入的tensor_in的tensor的最后一维C0必须是16。
  • window的维度必须为2,且为正整数,在[1, 32768]范围内。
  • stride的维度必须为2且为正整数类型,stride的width、height需在[1, 63]范围内。
  • 如果输入pad,那么pad的维度必须为4,pad值应 >= 0。
  • dilation的维度为2且为正整数类型,在【1, 255】范围内。
  • 当pooling_mode为MAX或AVG的VALID模式时需满足如下条件:

    out_w * window_h * window_w * C0 * SIZE_OF_FP16 + out_w * C0 * SIZE_OF_FP16 < ub_size

  • 当pooling_mode为AVG的SAME模式时需满足如下条件:

    out_w * window_h * window_w * C0 * SIZE_OF_FP16 + out_w * C0 * SIZE_OF_FP16

    + out_w * C0 * SIZE_OF_FP16 < ub_size

  • 当pooling_mode为MAX或AVG时,需满足 stride_h <= 2*window_h 且 stride_w <= 2*window_w。
  • 当pooling_mode为MAX或AVG时,需满足 window的width*height < 256。
  • 当pooling_mode为MAX或AVG时,tensor_in, pad, window 需满足:

    stride_h <= in_size_h + pad_top + pad_bottom – window_h

    stride_w <= in_size_w + pad_left + pad_right – window_w

  • 当pooling_mode为GAP或GMP时,需满足 window_h = in_size_h 且 window_w = in_size_w。
  • 当pooling_mode为GAP或GMP时,需满足 padding_mode = "VALID"。
  • ub_size为UB可用大小。
  • out_w为输出结果tensor的W。
  • window_h为window的height。
  • window_w为window的width。
  • C0为tensor_in的C0。
  • SIZE_OF_FP16为float16的大小。

函数原型

te.lang.cce.pooling2d(tensor_in, window, stride, pooling_mode, padding_mode="SAME", pad = (0,0,0,0), dilation = (1,1), data_mode=1, ceil_mode=0)

参数说明

  • tensor_in:输入的feature map,tvm.tensor类型。符合5D-NC1HWC0格式排布的tensor,各维度分别代表其NC1HWC0信息。
  • window:输入的滑块大小信息,list、tuple类型。window[0]表示输入window的width,window[1]输入window的height。
  • stride:输入的滑块移动步长信息,list、tuple类型。stride[0]表示window在feature map的W方向上移动的步长,stride[1]表示window在feature map的H方向上移动的步长。
  • pooling_mode:pooling模式,支持“MAX”、“AVG"、“GMP”、“GAP”,分别表示max pooling, avg pooling, global max pooling, global avg pooling。
    • MAX:max pooling 是取每个滑动窗口覆盖的元素的最大值作为计算输出。
    • AVG:avg pooling是取每个滑动窗口覆盖的元素的和除以窗口面积取平均值后作为输出。
    • GMP:global max pooling 为 max pooling 的特殊模式,feature map 大小和 window 大小一致,取 feature map 元素的最大值作为计算输出。
    • GAP:global avg pooling 为 avg pooling 的特殊模式,feature map 大小和 window 大小一致,取 feature map 元素之和取均值后作为计算输出。
  • padding_mode:padding模式,支持“VALID”、“SAME”,分别代表 不补pad、补pad。
    • VALID模式:

      当窗口在W方向或者H方向上的移动只能覆盖部分feature map时,丢弃掉这些不足一个完整窗口覆盖的数据,即:feature map 的这部分数据不参与计算。

      MAX , AVG, GMP, GAP 都包含VALID模式

    • SAME模式:

      当窗口在W方向或者H方向上的移动只能覆盖部分feature map时,补齐pad为0值至刚好能够满足一个完整窗口的覆盖,即:feature map 的这部分数据通过补 pad = 0 的方式参与计算。

      MAX and AVG pooling 包含SAME模式,GMP and GAP 没有SAME模式

  • pad:补pad的数目,list、tuple类型。可选参数,用于兼容caffe的pooling。pad[0], pad[1], pad[2], pad[3] 分别代表用户输入的在top, bottom, left, right方向补的pad,默认值为(0,0,0,0)。
  • dilation:膨胀系数,list、tuple类型。可选参数,dilation[0]、dilation[1]分别表示window在H、W方向的膨胀系数,默认值为(1,1)。
  • data_mode:模板使用类型,0: CAFFE_DATA_MODE, 1: TENSORFLOW_DATA_MODE。
  • ceil_mode:caffe 模式下的round_mode 参数, 0:CEIL(default), 1:FLOOR。

返回值

res_tensor:输出tensor,tvm.tensor类型,为符合5D-NC1HWC0格式排布的tensor。

将tensor_in 的shape信息记为[N, C1, H, W, C0=16],window 的shape信息记为 [F, F],stride 信息记为 [S, S],则:

MAX and AVG 的VALID模式与SAME模式下输出tensor的shape信息计算方式分别如下所示:

  • VALID模式下
    • N 和C 维度保持不变。
    • Hout 和 Wout 维度大小为:

  • SAME模式下
    • N 和C 维度保持不变。
    • Hout 和Wout 维度大小为:

      其中,W为输入size,F为filter的size,S为步长,[]为向上取整符号。

GMP and GAP的VALID模式下输出tensor的shape信息计算方式如下:
  • N 和C 维度保持不变。
  • Hout = Wout = 1

调用示例

from te import tvm
import te.lang.cce
shape = (1, 2, 416, 416, 16) 
input_dtype = "float16"
data = tvm.placeholder(shape, name="data", dtype=input_dtype) 
res = te.lang.cce.pooling2d(data, (3, 3), (2, 2), "AVG", "SAME")
# res.shape = (1, 2, 208, 208, 16)
分享:

    相关文档

    相关产品

close