新增OP

如果需要的算子不在算子列表中，则需要通过以下步骤添加新的算子。

添加算子解析
添加Layer实现
添加LayerAcc实现
添加单元测试

1. 添加算子解析

1.1 添加算子参数

添加LayerType
（1）修改文件 <path_to_TNN>/source/tnn/core/layer_type.h，在LayerType中添加新算子的枚举，格式为LAYER_XXX。（2）修改文件 <path_to_TNN>/source/tnn/core/layer_type.cc，在global_layer_type_map中添加新算子枚举值对应的算子名称，此名称与proto文件中层的名称一致。
添加LayerParam
如果新算子在proto里除了输入输出blob，还有其他参数，则需要添加LayerParam，修改文件 <path_to_TNN>/source/tnn/interpreter/layer_param.h，添加类似ConvLayerParam的结构，继承于LayerParam

 struct ConvLayerParam : public LayerParam {
     int pad_type = -1;
     // input channels of blob, devide by group
     int input_channel = 0;
     // the total output channels of blob, not devide by group
     int output_channel = 0;
     //[w_begin w_end h_begin h_end d_begin d_end]
     std::vector<int> pads;
     // order [w h d]
     std::vector<int> kernels;
     // order [w h d]
     std::vector<int> strides;
     // order [w h d]
     std::vector<int> dialations;
     int group           = 1;
     int bias            = 0;
     int activation_type = ActivationType_None;
 };

添加LayerResource
如果新算子有需要保存到model里的参数，则需要添加LayerResource，修改文件 <path_to_TNN>/source/tnn/interpreter/layer_resource.h，添加类似ConvLayerResource的结构，继承于LayerResource

 struct ConvLayerResource : public LayerResource {
     // conv layer filter format
     ConvLayerFilterFormat filter_format = OIHW;

     // conv layer handle
     // NOTE: for deconv, the weight's default format is  [n][i][o][h][w]
     RawBuffer filter_handle;

     // bias handle
     RawBuffer bias_handle;

     // extra scale handle for different precision
     RawBuffer scale_handle;
 };

1.2 添加LayerInterpreter

如果新算子添加了LayerParam或者LayerResource，则需要添加对应的LayerInterpreter。在文件夹<path_to_TNN>/source/tnn/interpreter/tnn/layer_interpreter下添加对应的实现。
（1）通过DECLARE_LAYER_INTERPRETER()声明新算子的Interpreter；
（2）通过REGISTER_LAYER_INTERPRETER()注册新算子的Interpreter；
（3）实现以下接口：

InterpretProto() -- 解析新算子的LayerParam
InterpretResource() -- 解析新算子的LayerResource
SaveProto() -- 保存新算子的LayerParam
SaveResource() -- 保存新算子的LayerResource

2. 添加Layer实现

在文件夹 <path_to_TNN>/source/tnn/layer 下添加对应layer的实现。
（1）DECLARE_LAYER() 声明新算子的Layer实现；
（2）REGISTER_LAYER() 注册新算子的Layer实现；
（3）实现以下接口：

InferOutputDataType() -- 设置对应层输出Blob的数据类型
InferOutputShape() -- 计算对应层输出Blob的大小

3. 添加LayerAcc实现

每个新的算子都需要实现对应设备的LayerAcc。

3.1 CPU平台

在文件夹<path_to_TNN>/source/tnn/device/cpu/acc下添加对应算子的LayerAcc实现。
（1）DECLARE_CPU_ACC() 声明新算子的LayerAcc实现；
（2）REGISTER_CPU_ACC() 注册新算子的LayerAcc实现；
（3）实现以下接口：

Forward() -- 新算子的cpu实现；

3.2 ARM平台

在文件夹<path_to_TNN>/source/tnn/device/arm/acc下添加对应算子的LayerAcc实现。
（1）声明新算子的LayerAcc实现，如果没有特殊的参数，可以直接使用DECLARE_ARM_ACC()声明；
（2）REGISTER_ARM_ACC() 注册新算子的LayerAcc实现；
（3）实现以下接口：

Init() -- 对LayerParam和LayerResource进行处理；
Reshape() -- 实现在输入blob大小改变的情况下的逻辑；
Forward() -- 新算子的ARM实现；

3.3 OpenCL平台

在文件夹<path_to_TNN>/source/tnn/device/opencl/acc下添加对应算子的LayerAcc实现。
（1）声明新算子的LayerAcc实现，如果没有特殊的参数，可以直接使用DECLARE_OPENCL_ACC()声明；
（2）REGISTER_OPENCL_ACC() 注册新算子的LayerAcc实现；
（3）实现以下接口：

Init() -- 对LayerParam和LayerResource进行处理，创建OpenCL的kernel；
Reshape() -- 实现在输入blob大小改变的情况下的逻辑，对于OpenCL，在此处调用SegArgs设置kernel参数；
Forward() -- 执行OpenCL的kernel；

（4）实现OpenCL的kernel，在目录 <path_to_TNN>/source/tnn/device/opencl/cl 添加对应的kernel文件，以.cl为后缀。添加之后需要执行脚本:

python opencl_codegen.py

3.4 Metal平台

在文件夹<path_to_TNN>/source/tnn/device/metal/acc下添加对应算子的LayerAcc实现。（1）声明新算子的LayerAcc实现，如果没有特殊的参数，可以直接使用DECLARE_METAL_ACC()声明；
（2）REGISTER_METAL_ACC() 注册新算子的LayerAcc实现；
（3）实现以下接口：

Init()
Reshape()
Forward()

（4）实现Metal的kernel，在目录 <path_to_TNN>/source/tnn/device/metal/acc 添加对应的metal文件，以.metal为后缀。

4. 添加单元测试

在文件夹 <path_to_TNN>/test/unit_test/layer_test 下添加对应层的单元测试文件。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

add_op.md

add_op.md

新增OP

1. 添加算子解析

1.1 添加算子参数

1.2 添加LayerInterpreter

2. 添加Layer实现

3. 添加LayerAcc实现

3.1 CPU平台

3.2 ARM平台

3.3 OpenCL平台

3.4 Metal平台

4. 添加单元测试

Files

add_op.md

Latest commit

History

add_op.md

File metadata and controls

新增OP

1. 添加算子解析

1.1 添加算子参数

1.2 添加LayerInterpreter

2. 添加Layer实现

3. 添加LayerAcc实现

3.1 CPU平台

3.2 ARM平台

3.3 OpenCL平台

3.4 Metal平台

4. 添加单元测试