PaddlePaddle · luotao1 · May 22, 2024 · Apr 22, 2024 · Apr 22, 2024 · Apr 22, 2024
diff --git a/paddle/fluid/inference/tensorrt/convert/cross_multihead_matmul_op.cc b/paddle/fluid/inference/tensorrt/convert/cross_multihead_matmul_op.cc
@@ -234,16 +234,13 @@ class CrossMultiheadMatMulOpConverter : public OpConverter {
     auto creator = GetPluginRegistry()->getPluginCreator("fMHCA", "1");
     assert(creator != nullptr);
     std::vector<nvinfer1::PluginField> fields{};
-    nvinfer1::PluginFieldCollection* plugin_collection =
-        static_cast<nvinfer1::PluginFieldCollection*>(
-            malloc(sizeof(*plugin_collection) +
-                   fields.size() *
-                       sizeof(nvinfer1::PluginField)));  // remember to free
+    std::unique_ptr<nvinfer1::PluginFieldCollection> plugin_collection(
+        new nvinfer1::PluginFieldCollection);
 
     plugin_collection->nbFields = static_cast<int>(fields.size());
     plugin_collection->fields = fields.data();
-    auto plugin = creator->createPlugin("fMHA_V2", plugin_collection);
-    free(plugin_collection);
+    auto plugin = creator->createPlugin("fMHA_V2", plugin_collection.get());
+    plugin_collection.reset();
     std::vector<nvinfer1::ITensor*> plugin_inputs;
     plugin_inputs.emplace_back(reshape_after_fc_q_layer->getOutput(0));
     plugin_inputs.emplace_back(reshape_after_fc_layer->getOutput(0));

diff --git a/paddle/fluid/inference/tensorrt/convert/emb_eltwise_layernorm.cc b/paddle/fluid/inference/tensorrt/convert/emb_eltwise_layernorm.cc
@@ -119,10 +119,8 @@ class EmbEltwiseLayerNormOpConverter : public OpConverter {
                             static_cast<int32_t>(emb_sizes[i]));
       }
 
-      nvinfer1::PluginFieldCollection* plugin_ptr =
-          static_cast<nvinfer1::PluginFieldCollection*>(
-              malloc(sizeof(*plugin_ptr) +
-                     fields.size() * sizeof(nvinfer1::PluginField)));
+      std::unique_ptr<nvinfer1::PluginFieldCollection> plugin_ptr(
+          new nvinfer1::PluginFieldCollection);
       plugin_ptr->nbFields = static_cast<int>(fields.size());
       plugin_ptr->fields = fields.data();
 
@@ -132,15 +130,15 @@ class EmbEltwiseLayerNormOpConverter : public OpConverter {
       auto creator = GetPluginRegistry()->getPluginCreator(
           "ManyEmbLayerNormVarlenPluginDynamic", "1");
       auto plugin_obj = creator->createPlugin(
-          "ManyEmbLayerNormVarlenPluginDynamic", plugin_ptr);
+          "ManyEmbLayerNormVarlenPluginDynamic", plugin_ptr.get());
 
       auto plugin_layer = engine_->network()->addPluginV2(
           plugin_inputs.data(), plugin_inputs.size(), *plugin_obj);
 
       plugin_layer->setName(("ManyEmbLayerNormVarlenPluginDynamicV1(Output: " +
                              op_desc.Output("Out")[0] + ")")
                                 .c_str());
-      free(plugin_ptr);
+      plugin_ptr.reset();
       if (enable_int8) {
         float out_scale =
             PADDLE_GET_CONST(float, op_desc.GetAttr("out_threshold"));
@@ -218,27 +216,25 @@ class EmbEltwiseLayerNormOpConverter : public OpConverter {
                             static_cast<int32_t>(emb_sizes[i]));
       }
 
-      nvinfer1::PluginFieldCollection* plugin_ptr =
-          static_cast<nvinfer1::PluginFieldCollection*>(
-              malloc(sizeof(*plugin_ptr) +
-                     fields.size() * sizeof(nvinfer1::PluginField)));
+      std::unique_ptr<nvinfer1::PluginFieldCollection> plugin_ptr(
+          new nvinfer1::PluginFieldCollection);
       plugin_ptr->nbFields = static_cast<int>(fields.size());
       plugin_ptr->fields = fields.data();
 
       std::vector<nvinfer1::ITensor*> plugin_inputs = input_ids;
 
       auto creator = GetPluginRegistry()->getPluginCreator(
           "ManyEmbLayerNormPluginDynamic", "1");
-      auto plugin_obj =
-          creator->createPlugin("ManyEmbLayerNormPluginDynamic", plugin_ptr);
+      auto plugin_obj = creator->createPlugin("ManyEmbLayerNormPluginDynamic",
+                                              plugin_ptr.get());
 
       auto plugin_layer = engine_->network()->addPluginV2(
           plugin_inputs.data(), plugin_inputs.size(), *plugin_obj);
 
       plugin_layer->setName(("ManyEmbLayerNormPluginDynamicV1(Output: " +
                              op_desc.Output("Out")[0] + ")")
                                 .c_str());
-      free(plugin_ptr);
+      plugin_ptr.reset();
       if (enable_int8) {
         float out_scale =
             PADDLE_GET_CONST(float, op_desc.GetAttr("out_threshold"));

diff --git a/paddle/fluid/inference/tensorrt/convert/flash_multihead_matmul_op.cc b/paddle/fluid/inference/tensorrt/convert/flash_multihead_matmul_op.cc
@@ -210,16 +210,12 @@ class FlashMultiheadMatMulOpConverter : public OpConverter {
     auto creator = GetPluginRegistry()->getPluginCreator("fMHA_V2", "1");
     assert("fmha_v2 plugin creater must not be null" && creator != nullptr);
     std::vector<nvinfer1::PluginField> fields{};
-    nvinfer1::PluginFieldCollection* plugin_collection =
-        static_cast<nvinfer1::PluginFieldCollection*>(
-            malloc(sizeof(*plugin_collection) +
-                   fields.size() *
-                       sizeof(nvinfer1::PluginField)));  // remember to free
-
+    std::unique_ptr<nvinfer1::PluginFieldCollection> plugin_collection(
+        new nvinfer1::PluginFieldCollection);
     plugin_collection->nbFields = static_cast<int>(fields.size());
     plugin_collection->fields = fields.data();
-    auto plugin = creator->createPlugin("fMHA_V2", plugin_collection);
-    free(plugin_collection);
+    auto plugin = creator->createPlugin("fMHA_V2", plugin_collection.get());
+    plugin_collection.reset();
     std::vector<nvinfer1::ITensor*> plugin_inputs;
     plugin_inputs.emplace_back(reshape_before_mha_layer->getOutput(0));
     auto plugin_layer = engine_->network()->addPluginV2(

diff --git a/paddle/fluid/inference/tensorrt/convert/multiclass_nms3_op.cc b/paddle/fluid/inference/tensorrt/convert/multiclass_nms3_op.cc
@@ -102,10 +102,8 @@ class MultiClassNMS3OpConverter : public OpConverter {
         {"clipBoxes", &clip_boxes, nvinfer1::PluginFieldType::kINT32, 1},
     };
 
-    nvinfer1::PluginFieldCollection* plugin_collections =
-        static_cast<nvinfer1::PluginFieldCollection*>(
-            malloc(sizeof(*plugin_collections) +
-                   fields.size() * sizeof(nvinfer1::PluginField)));
+    std::unique_ptr<nvinfer1::PluginFieldCollection> plugin_collections(
+        new nvinfer1::PluginFieldCollection);
     plugin_collections->nbFields = static_cast<int>(fields.size());
     plugin_collections->fields = fields.data();
     std::string nms_plugin_name = "BatchedNMS_TRT";
@@ -114,9 +112,9 @@ class MultiClassNMS3OpConverter : public OpConverter {
     }
     auto creator =
         GetPluginRegistry()->getPluginCreator(nms_plugin_name.c_str(), "1");
-    auto batch_nms_plugin =
-        creator->createPlugin(nms_plugin_name.c_str(), plugin_collections);
-    free(plugin_collections);
+    auto batch_nms_plugin = creator->createPlugin(nms_plugin_name.c_str(),
+                                                  plugin_collections.get());
+    plugin_collections.reset();
 
     auto batch_nms_layer = engine_->network()->addPluginV2(
         batch_nms_inputs.data(), batch_nms_inputs.size(), *batch_nms_plugin);

diff --git a/paddle/fluid/inference/tensorrt/convert/multiclass_nms_op.cc b/paddle/fluid/inference/tensorrt/convert/multiclass_nms_op.cc
@@ -100,10 +100,8 @@ class MultiClassNMSOpConverter : public OpConverter {
         {"clipBoxes", &clip_boxes, nvinfer1::PluginFieldType::kINT32, 1},
     };
 
-    nvinfer1::PluginFieldCollection* plugin_collections =
-        static_cast<nvinfer1::PluginFieldCollection*>(
-            malloc(sizeof(*plugin_collections) +
-                   fields.size() * sizeof(nvinfer1::PluginField)));
+    std::unique_ptr<nvinfer1::PluginFieldCollection> plugin_collections(
+        new nvinfer1::PluginFieldCollection);
     plugin_collections->nbFields = static_cast<int>(fields.size());
     plugin_collections->fields = fields.data();
 
@@ -113,9 +111,9 @@ class MultiClassNMSOpConverter : public OpConverter {
     }
     auto creator =
         GetPluginRegistry()->getPluginCreator(nms_plugin_name.c_str(), "1");
-    auto batch_nms_plugin =
-        creator->createPlugin(nms_plugin_name.c_str(), plugin_collections);
-    free(plugin_collections);
+    auto batch_nms_plugin = creator->createPlugin(nms_plugin_name.c_str(),
+                                                  plugin_collections.get());
+    plugin_collections.reset();
 
     auto batch_nms_layer = engine_->network()->addPluginV2(
         batch_nms_inputs.data(), batch_nms_inputs.size(), *batch_nms_plugin);

diff --git a/paddle/fluid/inference/tensorrt/convert/multihead_matmul_op.cc b/paddle/fluid/inference/tensorrt/convert/multihead_matmul_op.cc
@@ -234,17 +234,14 @@ class MultiheadMatMulOpConverter : public OpConverter {
                               nvinfer1::PluginFieldType::kFLOAT32,
                               1});
           }
-          nvinfer1::PluginFieldCollection* plugin_collection =
-              static_cast<nvinfer1::PluginFieldCollection*>(malloc(
-                  sizeof(*plugin_collection) +
-                  fields.size() *
-                      sizeof(nvinfer1::PluginField)));  // remember to free
+          std::unique_ptr<nvinfer1::PluginFieldCollection> plugin_collection(
+              new nvinfer1::PluginFieldCollection);
           plugin_collection->nbFields = static_cast<int>(fields.size());
           plugin_collection->fields = fields.data();
 
           auto plugin = creator->createPlugin("CustomQKVToContextPluginDynamic",
-                                              plugin_collection);
-          free(plugin_collection);
+                                              plugin_collection.get());
+          plugin_collection.reset();
 
           std::vector<nvinfer1::ITensor*> plugin_inputs;
           plugin_inputs.emplace_back(fc_layer->getOutput(0));
@@ -429,17 +426,14 @@ class MultiheadMatMulOpConverter : public OpConverter {
                               nvinfer1::PluginFieldType::kFLOAT32,
                               1});
           }
-          nvinfer1::PluginFieldCollection* plugin_collection =
-              static_cast<nvinfer1::PluginFieldCollection*>(malloc(
-                  sizeof(*plugin_collection) +
-                  fields.size() *
-                      sizeof(nvinfer1::PluginField)));  // remember to free
+          std::unique_ptr<nvinfer1::PluginFieldCollection> plugin_collection(
+              new nvinfer1::PluginFieldCollection);
           plugin_collection->nbFields = static_cast<int>(fields.size());
           plugin_collection->fields = fields.data();
 
           auto plugin = creator->createPlugin("CustomQKVToContextPluginDynamic",
-                                              plugin_collection);
-          free(plugin_collection);
+                                              plugin_collection.get());
+          plugin_collection.reset();
 
           std::vector<nvinfer1::ITensor*> plugin_inputs;
           plugin_inputs.emplace_back(
@@ -661,16 +655,13 @@ class MultiheadMatMulOpConverter : public OpConverter {
                &var_seqlen,
                nvinfer1::PluginFieldType::kINT32,
                1}};
-          nvinfer1::PluginFieldCollection* plugin_collection =
-              static_cast<nvinfer1::PluginFieldCollection*>(malloc(
-                  sizeof(*plugin_collection) +
-                  fields.size() *
-                      sizeof(nvinfer1::PluginField)));  // remember to free
+          std::unique_ptr<nvinfer1::PluginFieldCollection> plugin_collection(
+              new nvinfer1::PluginFieldCollection);
           plugin_collection->nbFields = static_cast<int>(fields.size());
           plugin_collection->fields = fields.data();
           auto plugin = creator->createPlugin("CustomQKVToContextPluginDynamic",
-                                              plugin_collection);
-          free(plugin_collection);
+                                              plugin_collection.get());
+          plugin_collection.reset();
           // set inputs
           std::vector<nvinfer1::ITensor*> plugin_inputs;
           // input_0 for plugin

diff --git a/paddle/fluid/inference/tensorrt/convert/preln_emb_eltwise_layernorm.cc b/paddle/fluid/inference/tensorrt/convert/preln_emb_eltwise_layernorm.cc
@@ -173,10 +173,8 @@ class PrelnEmbEltwiseLayerNormOpConverter : public OpConverter {
                           static_cast<int32_t>(emb_sizes[i]));
     }
 
-    nvinfer1::PluginFieldCollection* plugin_ptr =
-        static_cast<nvinfer1::PluginFieldCollection*>(
-            malloc(sizeof(*plugin_ptr) +
-                   fields.size() * sizeof(nvinfer1::PluginField)));
+    std::unique_ptr<nvinfer1::PluginFieldCollection> plugin_ptr(
+        new nvinfer1::PluginFieldCollection);
     plugin_ptr->nbFields = static_cast<int>(fields.size());
     plugin_ptr->fields = fields.data();
 
@@ -188,15 +186,15 @@ class PrelnEmbEltwiseLayerNormOpConverter : public OpConverter {
         "ManyEmbLayerNormVarlenPluginDynamic", "2");
 
     auto plugin_obj = creator->createPlugin(
-        "ManyEmbLayerNormVarlenPluginDynamic", plugin_ptr);
+        "ManyEmbLayerNormVarlenPluginDynamic", plugin_ptr.get());
 
     auto plugin_layer = engine_->network()->addPluginV2(
         plugin_inputs.data(), plugin_inputs.size(), *plugin_obj);
 
     plugin_layer->setName(("ManyEmbLayerNormPluginDynamic_V3(Output: " +
                            op_desc.Output("Out")[0] + ")")
                               .c_str());
-    free(plugin_ptr);
+    plugin_ptr.reset();
     float out_0_scale =
         PADDLE_GET_CONST(float, op_desc.GetAttr("out_0_threshold"));
     float out_1_scale =

diff --git a/paddle/fluid/inference/tensorrt/convert/prompt_tuning_emb_eltwise_layernorm.cc b/paddle/fluid/inference/tensorrt/convert/prompt_tuning_emb_eltwise_layernorm.cc
@@ -118,10 +118,8 @@ class PromptTuningEmbEltwiseLayerNormOpConverter : public OpConverter {
                           static_cast<int32_t>(emb_sizes[i]));
     }
 
-    nvinfer1::PluginFieldCollection* plugin_ptr =
-        static_cast<nvinfer1::PluginFieldCollection*>(
-            malloc(sizeof(*plugin_ptr) +
-                   fields.size() * sizeof(nvinfer1::PluginField)));
+    std::unique_ptr<nvinfer1::PluginFieldCollection> plugin_ptr(
+        new nvinfer1::PluginFieldCollection);
     plugin_ptr->nbFields = static_cast<int>(fields.size());
     plugin_ptr->fields = fields.data();
 
@@ -134,7 +132,7 @@ class PromptTuningEmbEltwiseLayerNormOpConverter : public OpConverter {
     auto creator = GetPluginRegistry()->getPluginCreator(
         "PromptTuningEmbLayerNormVarlenPluginDynamic", "1");
     auto plugin_obj = creator->createPlugin(
-        "PromptTuningEmbLayerNormVarlenPluginDynamic", plugin_ptr);
+        "PromptTuningEmbLayerNormVarlenPluginDynamic", plugin_ptr.get());
 
     auto plugin_layer = engine_->network()->addPluginV2(
         plugin_inputs.data(), plugin_inputs.size(), *plugin_obj);
@@ -143,7 +141,7 @@ class PromptTuningEmbEltwiseLayerNormOpConverter : public OpConverter {
         ("PromptTuningEmbLayerNormVarlenPluginDynamicV1(Output: " +
          op_desc.Output("Out")[0] + ")")
             .c_str());
-    free(plugin_ptr);
+    plugin_ptr.reset();
     if (enable_int8) {
       float out_scale =
           PADDLE_GET_CONST(float, op_desc.GetAttr("out_threshold"));

diff --git a/paddle/fluid/inference/tensorrt/convert/qk_multihead_matmul_op.cc b/paddle/fluid/inference/tensorrt/convert/qk_multihead_matmul_op.cc
@@ -258,16 +258,12 @@ class QkMultiheadMatMulOpConverter : public OpConverter {
     auto creator = GetPluginRegistry()->getPluginCreator("fMHA_V2", "1");
     assert(creator != nullptr);
     std::vector<nvinfer1::PluginField> fields{};
-    nvinfer1::PluginFieldCollection* plugin_collection =
-        static_cast<nvinfer1::PluginFieldCollection*>(
-            malloc(sizeof(*plugin_collection) +
-                   fields.size() *
-                       sizeof(nvinfer1::PluginField)));  // remember to free
-
+    std::unique_ptr<nvinfer1::PluginFieldCollection> plugin_collection(
+        new nvinfer1::PluginFieldCollection);
     plugin_collection->nbFields = static_cast<int>(fields.size());
     plugin_collection->fields = fields.data();
-    auto plugin = creator->createPlugin("fMHA_V2", plugin_collection);
-    free(plugin_collection);
+    auto plugin = creator->createPlugin("fMHA_V2", plugin_collection.get());
+    plugin_collection.reset();
     std::vector<nvinfer1::ITensor*> plugin_inputs;
     plugin_inputs.emplace_back(mha_input_tensor);
     auto plugin_layer = engine_->network()->addPluginV2(

diff --git a/paddle/fluid/inference/tensorrt/convert/skip_layernorm.cc b/paddle/fluid/inference/tensorrt/convert/skip_layernorm.cc
@@ -149,17 +149,15 @@ class SkipLayerNormOpConverter : public OpConverter {
            scale_weight.values,
            GetPluginFieldType(scale_weight.type),
            static_cast<int32_t>(scale_weight.count)}};
-      nvinfer1::PluginFieldCollection* pluginPtr =
-          static_cast<nvinfer1::PluginFieldCollection*>(
-              malloc(sizeof(nvinfer1::PluginFieldCollection) +
-                     fields.size() * sizeof(nvinfer1::PluginField)));
+      std::unique_ptr<nvinfer1::PluginFieldCollection> pluginPtr(
+          new nvinfer1::PluginFieldCollection);
       pluginPtr->nbFields = static_cast<int32_t>(fields.size());
       pluginPtr->fields = fields.data();
 
-      auto pluginObj =
-          creator->createPlugin("CustomSkipLayerNormPluginDynamic", pluginPtr);
+      auto pluginObj = creator->createPlugin("CustomSkipLayerNormPluginDynamic",
+                                             pluginPtr.get());
 
-      free(pluginPtr);
+      pluginPtr.reset();
 
       auto plugin_layer = engine_->network()->addPluginV2(
           inputs.data(), inputs.size(), *pluginObj);
@@ -213,18 +211,15 @@ class SkipLayerNormOpConverter : public OpConverter {
                           smooth_scale.data(),
                           nvinfer1::PluginFieldType::kFLOAT32,
                           static_cast<int32_t>(smooth_scale.size())});
-        nvinfer1::PluginFieldCollection* pluginPtr =
-            static_cast<nvinfer1::PluginFieldCollection*>(
-                malloc(sizeof(nvinfer1::PluginFieldCollection) +
-                       fields.size() *
-                           sizeof(nvinfer1::PluginField)));  // remember to free
+        std::unique_ptr<nvinfer1::PluginFieldCollection> pluginPtr(
+            new nvinfer1::PluginFieldCollection);
         pluginPtr->nbFields = static_cast<int32_t>(fields.size());
         pluginPtr->fields = fields.data();
 
         auto pluginObj = creator->createPlugin(
-            "CustomSkipLayerNormPluginDynamicWithSmooth", pluginPtr);
+            "CustomSkipLayerNormPluginDynamicWithSmooth", pluginPtr.get());
 
-        free(pluginPtr);
+        pluginPtr.reset();
 
         auto plugin_layer = engine_->network()->addPluginV2(
             inputs.data(), inputs.size(), *pluginObj);
@@ -237,18 +232,15 @@ class SkipLayerNormOpConverter : public OpConverter {
                 "layer"));
         layer = plugin_layer;
       } else {
-        nvinfer1::PluginFieldCollection* pluginPtr =
-            static_cast<nvinfer1::PluginFieldCollection*>(
-                malloc(sizeof(nvinfer1::PluginFieldCollection) +
-                       fields.size() *
-                           sizeof(nvinfer1::PluginField)));  // remember to free
+        std::unique_ptr<nvinfer1::PluginFieldCollection> pluginPtr(
+            new nvinfer1::PluginFieldCollection);
         pluginPtr->nbFields = static_cast<int32_t>(fields.size());
         pluginPtr->fields = fields.data();
 
         auto pluginObj = creator->createPlugin(
-            "CustomSkipLayerNormPluginDynamic", pluginPtr);
+            "CustomSkipLayerNormPluginDynamic", pluginPtr.get());
 
-        free(pluginPtr);
+        pluginPtr.reset();
 
         auto plugin_layer = engine_->network()->addPluginV2(
             inputs.data(), inputs.size(), *pluginObj);