更新时间:2021-03-18 GMT+08:00
分享

aclopExecute

函数功能

异步执行指定的算子。

约束说明

每个算子的输入、输出组织不同,需要应用在调用时严格按照算子输入、输出参数来组织算子。

用户在调用aclopExecute时,ACL根据optype、输入tensor的描述、输出tensor的描述、attr等信息查找对应的任务,并下发执行。

函数原型

aclError aclopExecute(const char *opType,

int numInputs,

const aclTensorDesc *const inputDesc[],

const aclDataBuffer *const inputs[],

int numOutputs,

const aclTensorDesc *const outputDesc[],

aclDataBuffer *const outputs[],

const aclopAttr *attr,

aclrtStream stream)

参数说明

参数名

输入/输出

说明

opType

输入

指定算子类型名称。

numInputs

输入

算子输入tensor的数量。

inputDesc

输入

算子输入tensor的描述。

inputs

输入

算子输入tensor。

numOutputs

输入

算子输出tensor的数量。

outputDesc

输入

算子输出tensor的描述。

outputs

输出

算子输出tensor。

attr

输入

算子属性。

stream

输入

该算子需要加载的stream。

返回值说明

返回0表示成功,返回其它值表示失败。

分享:

    相关文档

    相关产品

close