更新时间:2021-03-18 GMT+08:00
分享

vmla

功能说明

将tensor_0中每个元素乘上tensor_1中的对应元素,再加上tensor_2中的对应元素,对应的计算为tensor_0 * tensor_1 + tensor_2。

您可以在ATC安装目录下的“python/site-packages/te/te/lang/cce/te_compute/elewise_compute.py”查看接口定义。

约束说明

三个tensor的数据类型要求一致,shape需相同。

昇腾310 AI处理器:支持的数据类型有float16、float32

函数原型

te.lang.cce.vmla(tensor_0, tensor_1, tensor_2)

参数说明

  • tensor_0:tensor,tvm.tensor类型。
  • tensor_1:tensor,tvm.tensor类型。
  • tensor_2:tensor,tvm.tensor类型。

返回值

res_tensor:表示tensor_0 * tensor_1 + tensor_2,tvm.tensor类型。

调用示例

shape = (1024,1024)
input_dtype = "float16"
data1 = tvm.placeholder(shape, name="data1", dtype=input_dtype)
data2 = tvm.placeholder(shape, name="data2", dtype=input_dtype)
data3 = tvm.placeholder(shape, name="data3", dtype=input_dtype)
res = te.lang.cce.vmla(data1, data2, data3)
分享:

    相关文档

    相关产品

close