更新时间:2021-03-18 GMT+08:00
分享

conv

功能说明

在给定5HD格式的Data和FracZ格式的Weight的情况下计算float16的2-D卷积。

Data tensor 的shape是5HD,即(N, C1, H, W, C0);Weight Tensor 的shape是 FracZ,即 (C1*KH*KW, Cout//C0_out, C0_out, C0)。

接口可以支持bias。

您可以在ATC包的安装目录下的“python/site-packages/te/te/lang/cce/te_compute/conv_compute.py”查看接口定义。

约束说明

此接口暂不支持与其他TBE DSL接口混合使用。

支持的数据类型:float16。

函数原型

te.lang.cce.conv(data, weight, para_dict, optim_dict=None, dsl_flag=True)

参数说明

  • Data:2d卷积的FeatureMap,tensor,5HD格式,目前支持float16类型
  • Weight:2d卷积的Weight,tensor,FracZ格式,目前支持float16类型
  • para_dict:字典格式,包含各种参数,后续参数扩展一般都在para_dict
    其中目前在para_dict里必须要传的参数:
    • pad_h:int类型,2d卷积在FeatureMap H方向的补边。
    • pad_w:int类型,2d卷积在FeatureMap W方向的补边。
    • stride_h:int类型,2d卷积在FeatureMap H方向的移动步长。
    • stride_w:int类型,2d卷积在FeatureMap W方向的移动步长。
    • filter_h:int类型,2d卷积Filter H方向的大小。
    • filter_w:int类型,2d卷积Filter W方向的大小。

    其中目前在para_dict里支持的非必须参数:

    • Bias:tensor,目前支持float16类型,2d卷积的Bias。如果有该参数,则意味着卷积计算包含Bias,否则不包含Bias。并要求Bias是cout大小。
  • optim_dict:用户侧可控制优化特性的flag标志。
    字典格式,字典内的key值是bool类型。
    • True:表示对应特性开启
    • False表示对应特性不开启

    默认值是optim_dict = {"c0_optim_flg": False},表示不开启C0=4的优化特性。

    说明:当前仅支持c0_optim_flg的设置。

  • dsl_flag:是否支持UB自动融合,True:支持UB自动融合,False:不支持UB自动融合。

返回值

res_tensor:表示卷积计算的tensor,即卷积计算的结果输出。

调用示例

对于Batch=1,C=32,H=16,W=8的FeatureMap、Cout=32,KernelH=KernelW=1的Weight的float16的2D卷积,

对应的5HD的FeatureMap tensor的shape为(Batch,C/16,H,W,16)=(1,2,16,8,16)

对应的FracZ的Weight tensor的shape为 (KernelH*KernelW*C/16, Cout/16, 16, 16)=(2,2,16,16)

对应的Bias tensor的shape为(Cout,)=(32,)

import te
from te import tvm
 
shape_in = (1, 2, 16, 8, 16)
shape_w = (2, 2, 16, 16)
pad_h = 0
pad_w = 0
stride_h = 1
stride_w = 1
filter_h = 1
filter_w = 1
Data = tvm.placeholder(shape_in, name='FmapW', dtype="float16")
Weight = tvm.placeholder(shape_w, name='FilterW', dtype="float16")
bias_tensor = tvm.placeholder(
    (shape_w[1] * shape_w[2], ), name='Bias', dtype="float16")
res_tensor = te.lang.cce.conv(
    Data, Weight, {"bias_tensor": bias_tensor,
                   "pad_h": pad_h, "pad_w": pad_w,
                   "stride_h": stride_h, "stride_w": stride_w,
                   "filter_h": filter_h, "filter_w": filter_w,
                   "offset_a":0})
分享:

    相关文档

    相关产品

close