PaddlePaddle · kangguangli · Mar 20, 2024 · Mar 16, 2024 · Mar 18, 2024 · Mar 19, 2024
diff --git a/paddle/fluid/pir/dialect/op_generator/ops_api_gen.py b/paddle/fluid/pir/dialect/op_generator/ops_api_gen.py
@@ -143,6 +143,7 @@
     'dpsgd',
     'embedding_grad_sparse',
     'ftrl',
+    'fused_adam',
-    'fused_adam',
+    'fused_adam_',
-    'fused_adam',
+    'fused_adam_',
     'fused_batch_norm_act_',
     'fused_bn_add_activation_',
     'fused_elemwise_add_activation',

diff --git a/paddle/fluid/pir/dialect/operator/ir/ops.yaml b/paddle/fluid/pir/dialect/operator/ir/ops.yaml
@@ -741,16 +741,15 @@
     data_type : dtype
   interfaces : paddle::dialect::InferSymbolicShapeInterface
 
-- op : fused_adam_
+- op : fused_adam
- op : fused_adam
+- op : fused_adam_
- op : fused_adam
+- op : fused_adam_
   args : (Tensor[] params, Tensor[] grads, Tensor learning_rate, Tensor[] moments1, Tensor[] moments2, Tensor[] beta1_pows, Tensor[] beta2_pows, Tensor[] master_params, Tensor skip_update, Scalar beta1, Scalar beta2, Scalar epsilon, int chunk_size, float weight_decay, bool use_adamw, bool multi_precision, bool use_global_beta_pow)
   output : Tensor[](params_out){params.size()}, Tensor[](moments1_out){params.size()}, Tensor[](moments2_out){params.size()}, Tensor[](beta1_pows_out){params.size()}, Tensor[](beta2_pows_out){params.size()}, Tensor[](master_params_out){params.size()}
   infer_meta :
     func : FusedAdamInferMeta
   kernel :
     func : fused_adam
     data_type : params
-  optional : skip_update, master_params
-  inplace : (params -> params_out), (moments1 -> moments1_out), (moments2 -> moments2_out), (beta1_pows -> beta1_pows_out), (beta2_pows -> beta2_pows_out), (master_params -> master_params_out)
+  optional : skip_update, master_params, master_params_out
 
 - op : fused_batch_norm_act
   args : (Tensor x, Tensor scale, Tensor bias, Tensor mean, Tensor variance, float momentum, float epsilon, str act_type)

diff --git a/paddle/phi/api/yaml/legacy_ops.yaml b/paddle/phi/api/yaml/legacy_ops.yaml
@@ -560,16 +560,15 @@
     func : full_with_tensor
     data_type : dtype
 
-- op : fused_adam_
+- op : fused_adam
   args : (Tensor[] params, Tensor[] grads, Tensor learning_rate, Tensor[] moments1, Tensor[] moments2, Tensor[] beta1_pows, Tensor[] beta2_pows, Tensor[] master_params, Tensor skip_update, Scalar beta1, Scalar beta2, Scalar epsilon, int chunk_size, float weight_decay, bool use_adamw, bool multi_precision, bool use_global_beta_pow)
   output : Tensor[](params_out){params.size()}, Tensor[](moments1_out){params.size()}, Tensor[](moments2_out){params.size()}, Tensor[](beta1_pows_out){params.size()}, Tensor[](beta2_pows_out){params.size()}, Tensor[](master_params_out){params.size()}
   infer_meta :
     func : FusedAdamInferMeta
   kernel :
     func : fused_adam
     data_type : params
-  optional : skip_update, master_params
-  inplace : (params -> params_out), (moments1 -> moments1_out), (moments2 -> moments2_out), (beta1_pows -> beta1_pows_out), (beta2_pows -> beta2_pows_out), (master_params -> master_params_out)
+  optional : skip_update, master_params, master_params_out
 
 - op : fused_batch_norm_act
   args : (Tensor x, Tensor scale, Tensor bias, Tensor mean, Tensor variance, float momentum, float epsilon, str act_type)

diff --git a/paddle/phi/api/yaml/op_compat.yaml b/paddle/phi/api/yaml/op_compat.yaml
@@ -1254,6 +1254,15 @@
       data_type : float
       support_tensor : true
 
+- op : fused_adam
- op : fused_adam
+- op : fused_adam_(fused_adam)
- op : fused_adam
+- op : fused_adam_(fused_adam)
+  inputs :
+    {params : Params, grads : Grads, learning_rate : LearningRate, moments1 : Moments1,
+     moments2 : Moments2, beta1_pows : Beta1Pows, beta2_pows : Beta2Pows, master_params : MasterParams,
+     skip_update : SkipUpdate}
+  outputs :
+    {params_out : ParamsOut, moments1_out : Moments1Out, moments2_out : Moments2Out,
+     beta1_pows_out : Beta1PowsOut, beta2_pows_out : Beta2PowsOut, master_params_out : MasterParamsOut}
+
 - op : fused_attention
   backward: fused_attention_grad
   inputs:

diff --git a/test/white_list/pir_op_test_white_list b/test/white_list/pir_op_test_white_list
@@ -109,6 +109,7 @@ test_fold_op
 test_frame_op
 test_ftrl_op
 test_full_like_op
+test_fused_adam_op
 test_fused_attention_op
 test_fused_attention_op_api
 test_fused_bias_dropout_residual_layer_norm_op