address comments

liamzwbao · liamzwbao · commit 9b6d0e1ef603 · 2025-10-06T21:36:26.000-04:00
diff --git a/parquet-variant-compute/src/type_conversion.rs b/parquet-variant-compute/src/type_conversion.rs
@@ -63,42 +63,39 @@ impl_primitive_from_variant!(datatypes::Float64Type, as_f64);
 
 macro_rules! scale_variant_decimal {
     ($variant:expr, $variant_method:ident, $to_int_ty:expr, $output_scale:expr, $precision:expr, $validate:path) => {{
-        (|| -> Option<_> {
-            let variant = $variant.$variant_method()?;
-            let input_scale = variant.scale() as i8;
-            let variant = $to_int_ty(variant.integer());
-            let ten = $to_int_ty(10);
-
-            let scaled = if input_scale == $output_scale {
-                Some(variant)
-            } else if input_scale < $output_scale {
-                // scale_up means output has more fractional digits than input
-                // multiply integer by 10^(output_scale - input_scale)
-                let delta = ($output_scale - input_scale) as u32;
-                let mul = ten.checked_pow(delta)?;
-                variant.checked_mul(mul)
-            } else {
-                // scale_down means output has fewer fractional digits than input
-                // divide by 10^(input_scale - output_scale) with rounding
-                let delta = (input_scale - $output_scale) as u32;
-                let div = ten.checked_pow(delta)?;
-                let v = variant;
-                let d = v.checked_div(div)?;
-                let r = v % div;
-
-                // rounding in the same way as convert_to_smaller_scale_decimal in arrow-cast
-                let half = div.checked_div($to_int_ty(2))?;
-                let half_neg = half.checked_neg()?;
-                let adjusted = match v >= $to_int_ty(0) {
-                    true if r >= half => d.checked_add($to_int_ty(1))?,
-                    false if r <= half_neg => d.checked_sub($to_int_ty(1))?,
-                    _ => d,
-                };
-                Some(adjusted)
+        let variant = $variant.$variant_method()?;
+        let input_scale = variant.scale() as i8;
+        let variant = $to_int_ty(variant.integer());
+        let ten = $to_int_ty(10);
+
+        let scaled = if input_scale == $output_scale {
+            Some(variant)
+        } else if input_scale < $output_scale {
+            // scale_up means output has more fractional digits than input
+            // multiply integer by 10^(output_scale - input_scale)
+            let delta = ($output_scale - input_scale) as u32;
+            let mul = ten.checked_pow(delta)?;
+            variant.checked_mul(mul)
+        } else {
+            // scale_down means output has fewer fractional digits than input
+            // divide by 10^(input_scale - output_scale) with rounding
+            let delta = (input_scale - $output_scale) as u32;
+            let div = ten.checked_pow(delta)?;
+            let d = variant.checked_div(div)?;
+            let r = variant % div;
+
+            // rounding in the same way as convert_to_smaller_scale_decimal in arrow-cast
+            let half = div.checked_div($to_int_ty(2))?;
+            let half_neg = half.checked_neg()?;
+            let adjusted = match variant >= $to_int_ty(0) {
+                true if r >= half => d.checked_add($to_int_ty(1))?,
+                false if r <= half_neg => d.checked_sub($to_int_ty(1))?,
+                _ => d,
             };
+            Some(adjusted)
+        };
 
-            scaled.filter(|v| $validate(*v, $precision))
-        })()
+        scaled.filter(|v| $validate(*v, $precision))
     }};
 }
 pub(crate) use scale_variant_decimal;
@@ -151,9 +148,8 @@ macro_rules! decimal_to_variant_decimal {
         let (v, scale) = if *$scale < 0 {
             // For negative scale, we need to multiply the value by 10^|scale|
             // For example: 123 with scale -2 becomes 12300 with scale 0
-            let v = (10 as $value_type)
-                .checked_pow((-*$scale) as u32)
-                .and_then(|m| m.checked_mul($v));
+            let v =
+                <$value_type>::checked_pow(10, (-*$scale) as u32).and_then(|m| m.checked_mul($v));
             (v, 0u8)
         } else {
             (Some($v), *$scale as u8)
diff --git a/parquet-variant-compute/src/variant_get.rs b/parquet-variant-compute/src/variant_get.rs
@@ -308,10 +308,7 @@ mod test {
     use arrow::compute::CastOptions;
     use arrow::datatypes::DataType::{Int16, Int32, Int64};
     use arrow::datatypes::i256;
-    use arrow_schema::{
-        DECIMAL32_MAX_PRECISION, DECIMAL64_MAX_PRECISION, DECIMAL128_MAX_PRECISION, DataType,
-        Field, FieldRef, Fields,
-    };
+    use arrow_schema::{DataType, Field, FieldRef, Fields};
     use chrono::DateTime;
     use parquet_variant::{
         EMPTY_VARIANT_METADATA_BYTES, Variant, VariantDecimal4, VariantDecimal8, VariantDecimal16,
@@ -2688,18 +2685,6 @@ mod test {
         Arc::new(struct_array)
     }
 
-    macro_rules! max_unscaled_value {
-        (32, $precision:expr) => {
-            (u32::pow(10, $precision as u32) - 1) as i32
-        };
-        (64, $precision:expr) => {
-            (u64::pow(10, $precision as u32) - 1) as i64
-        };
-        (128, $precision:expr) => {
-            (u128::pow(10, $precision as u32) - 1) as i128
-        };
-    }
-
     #[test]
     fn get_decimal32_unshredded_var_scales_to_scale2() {
         // Build unshredded variant values with different scales
@@ -2750,7 +2735,7 @@ mod test {
         // Exceed Decimal32 max precision (9) after scaling
         let mut builder = crate::VariantArrayBuilder::new(1);
         builder.append_variant(Variant::from(
-            VariantDecimal4::try_new(max_unscaled_value!(32, DECIMAL32_MAX_PRECISION), 0).unwrap(),
+            VariantDecimal4::try_new(VariantDecimal4::MAX_UNSCALED_VALUE as i32, 0).unwrap(),
         ));
         let variant_array: ArrayRef = ArrayRef::from(builder.build());
 
@@ -2766,7 +2751,7 @@ mod test {
     fn get_decimal32_precision_overflow_unsafe_errors() {
         let mut builder = crate::VariantArrayBuilder::new(1);
         builder.append_variant(Variant::from(
-            VariantDecimal4::try_new(max_unscaled_value!(32, DECIMAL32_MAX_PRECISION), 0).unwrap(),
+            VariantDecimal4::try_new(VariantDecimal4::MAX_UNSCALED_VALUE as i32, 0).unwrap(),
         ));
         let variant_array: ArrayRef = ArrayRef::from(builder.build());
 
@@ -2836,7 +2821,7 @@ mod test {
         // Exceed Decimal64 max precision (18) after scaling
         let mut builder = crate::VariantArrayBuilder::new(1);
         builder.append_variant(Variant::from(
-            VariantDecimal8::try_new(max_unscaled_value!(64, DECIMAL64_MAX_PRECISION), 0).unwrap(),
+            VariantDecimal8::try_new(VariantDecimal8::MAX_UNSCALED_VALUE as i64, 0).unwrap(),
         ));
         let variant_array: ArrayRef = ArrayRef::from(builder.build());
 
@@ -2852,7 +2837,7 @@ mod test {
     fn get_decimal64_precision_overflow_unsafe_errors() {
         let mut builder = crate::VariantArrayBuilder::new(1);
         builder.append_variant(Variant::from(
-            VariantDecimal8::try_new(max_unscaled_value!(64, DECIMAL64_MAX_PRECISION), 0).unwrap(),
+            VariantDecimal8::try_new(VariantDecimal8::MAX_UNSCALED_VALUE as i64, 0).unwrap(),
         ));
         let variant_array: ArrayRef = ArrayRef::from(builder.build());
 
@@ -2922,8 +2907,7 @@ mod test {
         // Exceed Decimal128 max precision (38) after scaling
         let mut builder = crate::VariantArrayBuilder::new(1);
         builder.append_variant(Variant::from(
-            VariantDecimal16::try_new(max_unscaled_value!(128, DECIMAL128_MAX_PRECISION), 0)
-                .unwrap(),
+            VariantDecimal16::try_new(VariantDecimal16::MAX_UNSCALED_VALUE as i128, 0).unwrap(),
         ));
         let variant_array: ArrayRef = ArrayRef::from(builder.build());
 
@@ -2939,8 +2923,7 @@ mod test {
     fn get_decimal128_precision_overflow_unsafe_errors() {
         let mut builder = crate::VariantArrayBuilder::new(1);
         builder.append_variant(Variant::from(
-            VariantDecimal16::try_new(max_unscaled_value!(128, DECIMAL128_MAX_PRECISION), 0)
-                .unwrap(),
+            VariantDecimal16::try_new(VariantDecimal16::MAX_UNSCALED_VALUE as i128, 0).unwrap(),
         ));
         let variant_array: ArrayRef = ArrayRef::from(builder.build());
 
@@ -3009,12 +2992,10 @@ mod test {
         // Exceed Decimal128 max precision (38) after scaling
         let mut builder = crate::VariantArrayBuilder::new(2);
         builder.append_variant(Variant::from(
-            VariantDecimal16::try_new(max_unscaled_value!(128, DECIMAL128_MAX_PRECISION), 1)
-                .unwrap(),
+            VariantDecimal16::try_new(VariantDecimal16::MAX_UNSCALED_VALUE as i128, 1).unwrap(),
         ));
         builder.append_variant(Variant::from(
-            VariantDecimal16::try_new(max_unscaled_value!(128, DECIMAL128_MAX_PRECISION), 0)
-                .unwrap(),
+            VariantDecimal16::try_new(VariantDecimal16::MAX_UNSCALED_VALUE as i128, 0).unwrap(),
         ));
         let variant_array: ArrayRef = ArrayRef::from(builder.build());
 
@@ -3027,7 +3008,7 @@ mod test {
         // So expected integer is (10^38-1) * 10^(39-1) = (10^38-1) * 10^38
         let base = i256::from_i128(10);
         let factor = base.checked_pow(38).unwrap();
-        let expected = i256::from_i128(max_unscaled_value!(128, DECIMAL128_MAX_PRECISION))
+        let expected = i256::from_i128(VariantDecimal16::MAX_UNSCALED_VALUE as i128)
             .checked_mul(factor)
             .unwrap();
         assert_eq!(result.value(0), expected);
@@ -3039,12 +3020,10 @@ mod test {
         // Exceed Decimal128 max precision (38) after scaling
         let mut builder = crate::VariantArrayBuilder::new(2);
         builder.append_variant(Variant::from(
-            VariantDecimal16::try_new(max_unscaled_value!(128, DECIMAL128_MAX_PRECISION), 1)
-                .unwrap(),
+            VariantDecimal16::try_new(VariantDecimal16::MAX_UNSCALED_VALUE as i128, 1).unwrap(),
         ));
         builder.append_variant(Variant::from(
-            VariantDecimal16::try_new(max_unscaled_value!(128, DECIMAL128_MAX_PRECISION), 0)
-                .unwrap(),
+            VariantDecimal16::try_new(VariantDecimal16::MAX_UNSCALED_VALUE as i128, 0).unwrap(),
         ));
         let variant_array: ArrayRef = ArrayRef::from(builder.build());
 
diff --git a/parquet-variant-compute/src/variant_to_arrow.rs b/parquet-variant-compute/src/variant_to_arrow.rs
@@ -18,9 +18,9 @@
 use arrow::array::{ArrayRef, BinaryViewArray, NullBufferBuilder, PrimitiveBuilder};
 use arrow::compute::CastOptions;
 use arrow::datatypes::{
-    self, ArrowPrimitiveType, DataType, Decimal32Type, Decimal64Type, Decimal128Type,
-    Decimal256Type, i256, is_validate_decimal_precision, is_validate_decimal32_precision,
-    is_validate_decimal64_precision, is_validate_decimal256_precision,
+    self, ArrowPrimitiveType, DataType, i256, is_validate_decimal_precision,
+    is_validate_decimal32_precision, is_validate_decimal64_precision,
+    is_validate_decimal256_precision,
 };
 use arrow::error::{ArrowError, Result};
 use parquet_variant::{Variant, VariantPath};
@@ -376,18 +376,18 @@ impl<'a, T: PrimitiveFromVariant> VariantToPrimitiveArrowRowBuilder<'a, T> {
 }
 
 // Minimal per-decimal hook: just wraps scale_variant_decimal! with correct parameters
-pub(crate) trait VariantDecimalScaler: datatypes::DecimalType {
-    fn scale_from_variant(
+pub(crate) trait RescaleVariantDecimal: datatypes::DecimalType {
+    fn rescale_variant_decimal(
         value: &Variant<'_, '_>,
         scale: i8,
         precision: u8,
     ) -> Option<<Self as ArrowPrimitiveType>::Native>;
 }
 
-macro_rules! impl_variant_decimal_scaler {
+macro_rules! impl_rescale_variant_decimal {
     ($t:ty, $variant_method:ident, $to_native:expr, $validate:path) => {
-        impl VariantDecimalScaler for $t {
-            fn scale_from_variant(
+        impl RescaleVariantDecimal for $t {
+            fn rescale_variant_decimal(
                 value: &Variant<'_, '_>,
                 scale: i8,
                 precision: u8,
@@ -405,43 +405,40 @@ macro_rules! impl_variant_decimal_scaler {
     };
 }
 
-impl_variant_decimal_scaler!(
-    Decimal32Type,
+impl_rescale_variant_decimal!(
+    datatypes::Decimal32Type,
     as_decimal4,
-    |x: i32| x,
+    i32::from,
     is_validate_decimal32_precision
 );
-impl_variant_decimal_scaler!(
-    Decimal64Type,
+impl_rescale_variant_decimal!(
+    datatypes::Decimal64Type,
     as_decimal8,
-    |x: i64| x,
+    i64::from,
     is_validate_decimal64_precision
 );
-impl_variant_decimal_scaler!(
-    Decimal128Type,
+impl_rescale_variant_decimal!(
+    datatypes::Decimal128Type,
     as_decimal16,
-    |x: i128| x,
+    i128::from,
     is_validate_decimal_precision
 );
-impl_variant_decimal_scaler!(
-    Decimal256Type,
+impl_rescale_variant_decimal!(
+    datatypes::Decimal256Type,
     as_decimal16,
     i256::from_i128,
     is_validate_decimal256_precision
 );
 
 /// Builder for converting variant values to arrow Decimal values
-pub(crate) struct VariantToDecimalArrowRowBuilder<
-    'a,
-    T: datatypes::DecimalType + VariantDecimalScaler,
-> {
+pub(crate) struct VariantToDecimalArrowRowBuilder<'a, T: RescaleVariantDecimal> {
     builder: PrimitiveBuilder<T>,
     cast_options: &'a CastOptions<'a>,
     precision: u8,
     scale: i8,
 }
 
-impl<'a, T: datatypes::DecimalType + VariantDecimalScaler> VariantToDecimalArrowRowBuilder<'a, T> {
+impl<'a, T: RescaleVariantDecimal> VariantToDecimalArrowRowBuilder<'a, T> {
     fn new(
         cast_options: &'a CastOptions<'a>,
         capacity: usize,
@@ -464,7 +461,7 @@ impl<'a, T: datatypes::DecimalType + VariantDecimalScaler> VariantToDecimalArrow
     }
 
     fn append_value(&mut self, value: &Variant<'_, '_>) -> Result<bool> {
-        if let Some(scaled) = T::scale_from_variant(value, self.scale, self.precision) {
+        if let Some(scaled) = T::rescale_variant_decimal(value, self.scale, self.precision) {
             self.builder.append_value(scaled);
             Ok(true)
         } else if self.cast_options.safe {
diff --git a/parquet-variant/src/variant/decimal.rs b/parquet-variant/src/variant/decimal.rs
@@ -87,7 +87,7 @@ pub struct VariantDecimal4 {
 
 impl VariantDecimal4 {
     pub(crate) const MAX_PRECISION: u8 = 9;
-    pub(crate) const MAX_UNSCALED_VALUE: u32 = u32::pow(10, Self::MAX_PRECISION as u32) - 1;
+    pub const MAX_UNSCALED_VALUE: u32 = u32::pow(10, Self::MAX_PRECISION as u32) - 1;
 
     pub fn try_new(integer: i32, scale: u8) -> Result<Self, ArrowError> {
         decimal_try_new!(integer, scale)
@@ -137,7 +137,7 @@ pub struct VariantDecimal8 {
 
 impl VariantDecimal8 {
     pub(crate) const MAX_PRECISION: u8 = 18;
-    pub(crate) const MAX_UNSCALED_VALUE: u64 = u64::pow(10, Self::MAX_PRECISION as u32) - 1;
+    pub const MAX_UNSCALED_VALUE: u64 = u64::pow(10, Self::MAX_PRECISION as u32) - 1;
 
     pub fn try_new(integer: i64, scale: u8) -> Result<Self, ArrowError> {
         decimal_try_new!(integer, scale)
@@ -187,7 +187,7 @@ pub struct VariantDecimal16 {
 
 impl VariantDecimal16 {
     const MAX_PRECISION: u8 = 38;
-    const MAX_UNSCALED_VALUE: u128 = u128::pow(10, Self::MAX_PRECISION as u32) - 1;
+    pub const MAX_UNSCALED_VALUE: u128 = u128::pow(10, Self::MAX_PRECISION as u32) - 1;
 
     pub fn try_new(integer: i128, scale: u8) -> Result<Self, ArrowError> {
         decimal_try_new!(integer, scale)