aclopExecute
函数功能
异步执行指定的算子。
约束说明
每个算子的输入、输出组织不同,需要应用在调用时严格按照算子输入、输出参数来组织算子。
用户在调用aclopExecute时,ACL根据optype、输入tensor的描述、输出tensor的描述、attr等信息查找对应的任务,并下发执行。
函数原型
aclError aclopExecute(const char *opType,
int numInputs,
const aclTensorDesc *const inputDesc[],
const aclDataBuffer *const inputs[],
int numOutputs,
const aclTensorDesc *const outputDesc[],
aclDataBuffer *const outputs[],
const aclopAttr *attr,
aclrtStream stream)
参数说明
参数名 |
输入/输出 |
说明 |
---|---|---|
opType |
输入 |
指定算子类型名称。 |
numInputs |
输入 |
算子输入tensor的数量。 |
inputDesc |
输入 |
算子输入tensor的描述。 |
inputs |
输入 |
算子输入tensor。 |
numOutputs |
输入 |
算子输出tensor的数量。 |
outputDesc |
输入 |
算子输出tensor的描述。 |
outputs |
输出 |
算子输出tensor。 |
attr |
输入 |
算子属性。 |
stream |
输入 |
该算子需要加载的stream。 |
返回值说明
返回0表示成功,返回其它值表示失败。
