[structural binding][9/N] Replace std::tie with structural binding (#130404)

cyyever · pytorchmergebot · commit 6beec34b1c68 · 2024-07-15T10:14:52.000Z
Follows #130544 Pull Request resolved: #130404 Approved by: https://github.com/janeyx99
diff --git a/aten/src/ATen/native/cpu/FusedAdagradKernel.cpp b/aten/src/ATen/native/cpu/FusedAdagradKernel.cpp
@@ -28,20 +28,16 @@ typename std::enable_if<
 ){
   using lpVec = at::vec::Vectorized<scalar_t>;
   using fVec = at::vec::Vectorized<opmath_t>;
-  lpVec grad_vec_to_store;
-  fVec param_vec1, param_vec2;
-  fVec grad_vec1, grad_vec2;
-  fVec state_sum_vec1, state_sum_vec2;
   int64_t d = 0;
   for (; d < size - (size % lpVec::size()); d += lpVec::size()) {
     lpVec param_lpvec = lpVec::loadu(param_ptr + d);
-    std::tie(param_vec1, param_vec2) = vec::convert_to_float<scalar_t>(param_lpvec);
+    auto [param_vec1, param_vec2] = vec::convert_to_float<scalar_t>(param_lpvec);
     lpVec grad_lpvec = lpVec::loadu(grad_ptr + d);
-    std::tie(grad_vec1, grad_vec2) = vec::convert_to_float<scalar_t>(grad_lpvec);
+    auto [grad_vec1, grad_vec2] = vec::convert_to_float<scalar_t>(grad_lpvec);
     if (grad_scale_ptr) {
       grad_vec1 = grad_vec1 / fVec(float(*grad_scale_ptr));
       grad_vec2 = grad_vec2 / fVec(float(*grad_scale_ptr));
-      grad_vec_to_store = vec::convert_from_float<scalar_t>(grad_vec1, grad_vec2);
+      lpVec grad_vec_to_store = vec::convert_from_float<scalar_t>(grad_vec1, grad_vec2);
       grad_vec_to_store.store(grad_ptr + d);
     }
     if (maximize){
@@ -52,7 +48,7 @@ typename std::enable_if<
       grad_vec1 += param_vec1 * fVec(scalar_t(weight_decay));
       grad_vec2 += param_vec2 * fVec(scalar_t(weight_decay));
     }
-    std::tie(state_sum_vec1, state_sum_vec2) = vec::convert_to_float<scalar_t>(lpVec::loadu(state_sum_ptr + d));
+    auto [state_sum_vec1, state_sum_vec2] = vec::convert_to_float<scalar_t>(lpVec::loadu(state_sum_ptr + d));
     state_sum_vec1 += grad_vec1 * grad_vec1;
     state_sum_vec2 += grad_vec2 * grad_vec2;
     vec::convert_from_float<scalar_t>(state_sum_vec1, state_sum_vec2).store(state_sum_ptr + d);
@@ -63,14 +59,12 @@ typename std::enable_if<
     param_vec2 = param_vec2 - fVec(scalar_t(clr)) * grad_vec2 / std_vec2;
     vec::convert_from_float<scalar_t>(param_vec1, param_vec2).store(param_ptr + d);
   }
-  scalar_t grad_val_to_store;
   for (; d < size; d++) {
     opmath_t grad_val = grad_ptr[d];
     opmath_t param_val = param_ptr[d];
     if (grad_scale_ptr) {
       grad_val = grad_ptr[d] / opmath_t(*grad_scale_ptr);
-      grad_val_to_store = grad_val;
-      grad_ptr[d] = grad_val_to_store;
+      grad_ptr[d] = grad_val;
     }
     if (maximize) grad_val = -grad_val;
     if (weight_decay != 0.0){
@@ -102,14 +96,13 @@ typename std::enable_if<
   int64_t size
 ){
   using Vec = at::vec::Vectorized<scalar_t>;
-  Vec grad_vec_to_store;
   int64_t d = 0;
   for (; d < size - (size % Vec::size()); d += Vec::size()) {
     Vec param_vec = Vec::loadu(param_ptr + d);
     Vec grad_vec = Vec::loadu(grad_ptr + d);
     if (grad_scale_ptr) {
       grad_vec = grad_vec / Vec(scalar_t(*grad_scale_ptr));
-      grad_vec_to_store = grad_vec;
+      Vec grad_vec_to_store = grad_vec;
       grad_vec_to_store.store(grad_ptr + d);
     }
     if (maximize) grad_vec = grad_vec * Vec(scalar_t(-1.0));
diff --git a/aten/src/ATen/native/cpu/FusedAdamKernel.cpp b/aten/src/ATen/native/cpu/FusedAdamKernel.cpp
@@ -38,22 +38,16 @@ typename std::enable_if<
   double step_size = lr / bias_correction1;
   using lpVec = at::vec::Vectorized<scalar_t>;
   using fVec = at::vec::Vectorized<opmath_t>;
-  lpVec grad_vec_to_store;
   int64_t d = 0;
-  fVec param_vec1, param_vec2;
-  fVec grad_vec1, grad_vec2;
-  fVec exp_avg_vec1, exp_avg_vec2;
-  fVec exp_avg_sq_vec1, exp_avg_sq_vec2;
-  fVec max_exp_avg_sq_vec1, max_exp_avg_sq_vec2;
   for (; d < size - (size % lpVec::size()); d += lpVec::size()) {
     lpVec param_lpvec = lpVec::loadu(param_ptr + d);
-    std::tie(param_vec1, param_vec2) = vec::convert_to_float<scalar_t>(param_lpvec);
+    auto [param_vec1, param_vec2] = vec::convert_to_float<scalar_t>(param_lpvec);
     lpVec grad_lpvec = lpVec::loadu(grad_ptr + d);
-    std::tie(grad_vec1, grad_vec2) = vec::convert_to_float<scalar_t>(grad_lpvec);
+    auto [grad_vec1, grad_vec2] = vec::convert_to_float<scalar_t>(grad_lpvec);
     if (grad_scale_ptr) {
       grad_vec1 = grad_vec1 / fVec(float(*grad_scale_ptr));
       grad_vec2 = grad_vec2 / fVec(float(*grad_scale_ptr));
-      grad_vec_to_store = vec::convert_from_float<scalar_t>(grad_vec1, grad_vec2);
+      lpVec grad_vec_to_store = vec::convert_from_float<scalar_t>(grad_vec1, grad_vec2);
       grad_vec_to_store.store(grad_ptr + d);
     }
     if (maximize){
@@ -71,7 +65,7 @@ typename std::enable_if<
     }
 
     lpVec exp_avg_lpvec = lpVec::loadu(exp_avg_ptr + d);
-    std::tie(exp_avg_vec1, exp_avg_vec2) = vec::convert_to_float<scalar_t>(exp_avg_lpvec);
+    auto [exp_avg_vec1, exp_avg_vec2] = vec::convert_to_float<scalar_t>(exp_avg_lpvec);
 
     // exp_avg.lerp_(grad, 1 - beta1)
     const fVec lerp_weight = fVec(opmath_t(exp_avg_grad_coefficient));
@@ -85,7 +79,7 @@ typename std::enable_if<
     exp_avg_vec2 = vec::fmadd(coeff, grad_vec2 - exp_avg_vec2, base2);
 
     lpVec exp_avg_sq_lpvec = lpVec::loadu(exp_avg_sq_ptr + d);
-    std::tie(exp_avg_sq_vec1, exp_avg_sq_vec2) = vec::convert_to_float<scalar_t>(exp_avg_sq_lpvec);
+    auto [exp_avg_sq_vec1, exp_avg_sq_vec2] = vec::convert_to_float<scalar_t>(exp_avg_sq_lpvec);
     exp_avg_sq_vec1 = exp_avg_sq_vec1 * fVec(opmath_t(beta2)) +
         fVec(opmath_t(exp_avg_sq_grad_coefficient)) * grad_vec1 * grad_vec1;
     exp_avg_sq_vec2 = exp_avg_sq_vec2 * fVec(opmath_t(beta2)) +
@@ -97,7 +91,7 @@ typename std::enable_if<
     fVec denom_vec1, denom_vec2;
     if (amsgrad) {
       lpVec max_exp_avg_sq_lpvec = lpVec::loadu(max_exp_avg_sq_ptr + d);
-      std::tie(max_exp_avg_sq_vec1, max_exp_avg_sq_vec2) = vec::convert_to_float<scalar_t>(max_exp_avg_sq_lpvec);
+      auto [max_exp_avg_sq_vec1, max_exp_avg_sq_vec2] = vec::convert_to_float<scalar_t>(max_exp_avg_sq_lpvec);
       max_exp_avg_sq_vec1 = maximum(max_exp_avg_sq_vec1, exp_avg_sq_vec1);
       max_exp_avg_sq_vec2 = maximum(max_exp_avg_sq_vec2, exp_avg_sq_vec2);
       vec::convert_from_float<scalar_t>(max_exp_avg_sq_vec1, max_exp_avg_sq_vec2).store(max_exp_avg_sq_ptr + d);
@@ -115,14 +109,12 @@ typename std::enable_if<
     param_vec2 = param_vec2 + fVec(opmath_t(-step_size)) * exp_avg_vec2 / denom_vec2;
     vec::convert_from_float<scalar_t>(param_vec1, param_vec2).store(param_ptr + d);
   }
-  scalar_t grad_val_to_store;
   for (; d < size; d++) {
     opmath_t grad_val = grad_ptr[d];
     opmath_t param_val = param_ptr[d];
     if (grad_scale_ptr) {
       grad_val = grad_ptr[d] / float(*grad_scale_ptr);
-      grad_val_to_store = scalar_t(grad_val);
-      grad_ptr[d] = grad_val_to_store;
+      grad_ptr[d] = grad_val;
     }
     if (maximize) grad_val = -grad_val;
     if (weight_decay != 0.f){
@@ -188,14 +180,13 @@ typename std::enable_if<
 ){
   double step_size = lr / bias_correction1;
   using Vec = at::vec::Vectorized<scalar_t>;
-  Vec grad_vec_to_store;
   int64_t d = 0;
   for (; d < size - (size % Vec::size()); d += Vec::size()) {
     Vec param_vec = Vec::loadu(param_ptr + d);
     Vec grad_vec = Vec::loadu(grad_ptr + d);
     if (grad_scale_ptr) {
       grad_vec = grad_vec / Vec(scalar_t(*grad_scale_ptr));
-      grad_vec_to_store = grad_vec;
+      Vec grad_vec_to_store = grad_vec;
       grad_vec_to_store.store(grad_ptr + d);
     }
     if (maximize) grad_vec = grad_vec * Vec(scalar_t(-1.0));
@@ -233,13 +224,11 @@ typename std::enable_if<
     param_vec = param_vec + Vec(scalar_t(-step_size)) * exp_avg_vec / denom_vec;
     param_vec.store(param_ptr + d);
   }
-  scalar_t grad_val_to_store;
   for (; d < size; d++) {
     scalar_t grad_val = grad_ptr[d];
     if (grad_scale_ptr) {
       grad_val = grad_ptr[d] / scalar_t(*grad_scale_ptr);
-      grad_val_to_store = grad_val;
-      grad_ptr[d] = grad_val_to_store;
+      grad_ptr[d] = grad_val;
     }
     if (maximize) grad_val = -grad_val;
     if (weight_decay != 0.f){
diff --git a/aten/src/ATen/native/cpu/FusedSGDKernel.cpp b/aten/src/ATen/native/cpu/FusedSGDKernel.cpp
@@ -31,20 +31,16 @@ typename std::enable_if<
 ){
   using lpVec = at::vec::Vectorized<scalar_t>;
   using fVec = at::vec::Vectorized<opmath_t>;
-  lpVec grad_vec_to_store;
-  fVec param_vec1, param_vec2;
-  fVec grad_vec1, grad_vec2;
-  fVec momentum_buffer_vec1, momentum_buffer_vec2;
   int64_t d = 0;
   for (; d < size - (size % lpVec::size()); d += lpVec::size()) {
     lpVec param_lpvec = lpVec::loadu(param_ptr + d);
-    std::tie(param_vec1, param_vec2) = vec::convert_to_float<scalar_t>(param_lpvec);
+    auto [param_vec1, param_vec2] = vec::convert_to_float<scalar_t>(param_lpvec);
     lpVec grad_lpvec = lpVec::loadu(grad_ptr + d);
-    std::tie(grad_vec1, grad_vec2) = vec::convert_to_float<scalar_t>(grad_lpvec);
+    auto [grad_vec1, grad_vec2] = vec::convert_to_float<scalar_t>(grad_lpvec);
     if (grad_scale_ptr) {
       grad_vec1 = grad_vec1 / fVec(float(*grad_scale_ptr));
       grad_vec2 = grad_vec2 / fVec(float(*grad_scale_ptr));
-      grad_vec_to_store = vec::convert_from_float<scalar_t>(grad_vec1, grad_vec2);
+      lpVec grad_vec_to_store = vec::convert_from_float<scalar_t>(grad_vec1, grad_vec2);
       grad_vec_to_store.store(grad_ptr + d);
     }
     if (maximize){
@@ -61,7 +57,6 @@ typename std::enable_if<
         momentum_vec1 = grad_vec1;
         momentum_vec2 = grad_vec2;
       } else {
-
         momentum_vec1 = fVec::loadu(momentum_buf_ptr + d) * fVec(scalar_t(momentum));
         momentum_vec2 = fVec::loadu(momentum_buf_ptr + d + fVec::size()) * fVec(scalar_t(momentum));
         momentum_vec1 = vec::fmadd(fVec(scalar_t(1 - dampening)), grad_vec1, momentum_vec1);
@@ -77,14 +72,12 @@ typename std::enable_if<
       }
     }
   }
-  scalar_t grad_val_to_store;
   for (; d < size; d++) {
     opmath_t grad_val = grad_ptr[d];
     opmath_t param_val = param_ptr[d];
     if (grad_scale_ptr) {
       grad_val = grad_ptr[d] / opmath_t(*grad_scale_ptr);
-      grad_val_to_store = grad_val;
-      grad_ptr[d] = grad_val_to_store;
+      grad_ptr[d] = grad_val;
     }
     if (maximize) grad_val = -grad_val;
     if (weight_decay != 0.0){
@@ -129,14 +122,13 @@ typename std::enable_if<
   int64_t size
 ){
   using Vec = at::vec::Vectorized<scalar_t>;
-  Vec grad_vec_to_store;
   int64_t d = 0;
   for (; d < size - (size % Vec::size()); d += Vec::size()) {
     Vec param_vec = Vec::loadu(param_ptr + d);
     Vec grad_vec = Vec::loadu(grad_ptr + d);
     if (grad_scale_ptr) {
       grad_vec = grad_vec / Vec(scalar_t(*grad_scale_ptr));
-      grad_vec_to_store = grad_vec;
+      Vec grad_vec_to_store = grad_vec;
       grad_vec_to_store.store(grad_ptr + d);
     }
     if (maximize) grad_vec = grad_vec * Vec(scalar_t(-1.0));
@@ -162,13 +154,11 @@ typename std::enable_if<
     param_vec += grad_vec * Vec(scalar_t(-lr));
     param_vec.store(param_ptr + d);
   }
-  scalar_t grad_val_to_store;
   for (; d < size; d++) {
     scalar_t grad_val = grad_ptr[d];
     if (grad_scale_ptr) {
       grad_val = grad_ptr[d] / scalar_t(*grad_scale_ptr);
-      grad_val_to_store = grad_val;
-      grad_ptr[d] = grad_val_to_store;
+      grad_ptr[d] = grad_val;
     }
     if (maximize) grad_val = -grad_val;
     if (weight_decay != 0.0){
diff --git a/aten/src/ATen/native/nested/cuda/NestedTensorTransformerFunctions.cu b/aten/src/ATen/native/nested/cuda/NestedTensorTransformerFunctions.cu
@@ -757,9 +757,7 @@ void jagged_dense_elementwise_dense_output_(
 
 #define INVOKE_KERNEL_WITH_DIM(NUM_JAGGED_DIM)                                 \
   {                                                                            \
-    dim3 threads, blocks;                                                      \
-    StackArray<int64_t> jagged_dims_tensor;                                    \
-    std::tie(threads, blocks, jagged_dims_tensor) =                            \
+    auto [threads, blocks, jagged_dims_tensor] =                               \
         check_shape_and_partition_(x_values, x_offsets, y);                    \
     blocks.x = div_round_up(x_values.size(0), threads.y);                      \
     std::vector<Tensor> x_offsets_contig;                                      \
diff --git a/aten/src/ATen/native/nested/cuda/NestedTensorTransformerUtils.cpp b/aten/src/ATen/native/nested/cuda/NestedTensorTransformerUtils.cpp
@@ -412,24 +412,8 @@ sdpa_nested_preprocessing(
   Tensor k_t = key.transpose(1, 2);
   Tensor v_t = value.transpose(1, 2);
 
-  auto cumulative_and_max_q_and_nnz_q = cumulative_and_max_seq_len_nnz(q_t);
-  auto cumulative_and_max_kv_and_nnz_kv = cumulative_and_max_seq_len_nnz(k_t);
-
-  // [TODO] K and V have to have the same Nnz, should probably torch_check
-  // assume in order to not iterate over v
-
-  Tensor cumulative_sequence_length_q =
-      std::get<0>(cumulative_and_max_q_and_nnz_q);
-  Tensor cumulative_sequence_length_kv =
-      std::get<0>(cumulative_and_max_kv_and_nnz_kv);
-
-  const int64_t max_seqlen_batch_q =
-      std::get<1>(cumulative_and_max_q_and_nnz_q);
-  const int64_t max_seqlen_batch_kv =
-      std::get<1>(cumulative_and_max_kv_and_nnz_kv);
-
-  const int64_t Nnz_q = std::get<2>(cumulative_and_max_q_and_nnz_q);
-  const int64_t Nnz_kv = std::get<2>(cumulative_and_max_kv_and_nnz_kv);
+  auto [cumulative_sequence_length_q, max_seqlen_batch_q, Nnz_q] = cumulative_and_max_seq_len_nnz(q_t);
+  auto [cumulative_sequence_length_kv, max_seqlen_batch_kv, Nnz_kv]= cumulative_and_max_seq_len_nnz(k_t);
 
   Tensor query_buffer_reshaped;
   Tensor key_buffer_reshaped;