apache · Weijun-H · Dec 11, 2023 · Dec 11, 2023 · Dec 15, 2023 · Dec 15, 2023
diff --git a/datafusion/sql/src/expr/value.rs b/datafusion/sql/src/expr/value.rs
@@ -18,7 +18,7 @@
 use crate::planner::{ContextProvider, PlannerContext, SqlToRel};
 use arrow::compute::kernels::cast_utils::parse_interval_month_day_nano;
 use arrow::datatypes::DECIMAL128_MAX_PRECISION;
-use arrow_schema::DataType;
+use arrow_schema::{DataType, DECIMAL128_MAX_SCALE};
 use datafusion_common::{
     not_impl_err, plan_err, DFSchema, DataFusionError, Result, ScalarValue,
 };
@@ -405,11 +405,29 @@ const fn try_decode_hex_char(c: u8) -> Option<u8> {
 }
 
 /// Parse Decimal128 from a string
-///
-/// TODO: support parsing from scientific notation
 fn parse_decimal_128(unsigned_number: &str, negative: bool) -> Result<Expr> {
     // remove leading zeroes
     let trimmed = unsigned_number.trim_start_matches('0');
+
+    // check if the number is scientific notation
+    let parts = trimmed.split(|c| c == 'e' || c == 'E').collect::<Vec<_>>();
+
+    let (trimmed, e_scale) = if parts.len() == 1 {
+        (trimmed, 0)
+    } else if parts.len() == 2 {
+        let e_scale = parts[1].parse::<i16>().map_err(|e| {
+            DataFusionError::from(ParserError(format!(
+                "Cannot parse {} as i32 when building decimal: {e}",
+                parts[1]
+            )))
+        })?;
+        (parts[0], e_scale)
+    } else {
+        return Err(DataFusionError::from(ParserError(format!(
+            "Cannot parse {unsigned_number} as i128 when building decimal: invalid format"
+        ))));
+    };
+
     // parse precision and scale, remove decimal point if exists
     let (precision, scale, replaced_str) = if trimmed == "." {
         // special cases for numbers such as “0.”, “000.”, and so on.
@@ -425,17 +443,24 @@ fn parse_decimal_128(unsigned_number: &str, negative: bool) -> Result<Expr> {
         (trimmed.len(), 0, Cow::Borrowed(trimmed))
     };
 
+    let (precision, scale) = if e_scale > 0 {
+        (precision as i16 + e_scale, scale as i16 - e_scale)
+    } else {
+        (precision as i16 - e_scale, scale as i16 - e_scale)
+    };
+
     let number = replaced_str.parse::<i128>().map_err(|e| {
         DataFusionError::from(ParserError(format!(
             "Cannot parse {replaced_str} as i128 when building decimal: {e}"
         )))
     })?;
 
     // check precision overflow
-    if precision as u8 > DECIMAL128_MAX_PRECISION {
+    if precision > DECIMAL128_MAX_PRECISION as i16 || scale > DECIMAL128_MAX_SCALE as i16
+    {
         return Err(DataFusionError::from(ParserError(format!(
-            "Cannot parse {replaced_str} as i128 when building decimal: precision overflow"
-        ))));
+                "Cannot parse {replaced_str} as i128 when building decimal: precision overflow"
+            ))));
     }
 
     Ok(Expr::Literal(ScalarValue::Decimal128(
@@ -468,4 +493,10 @@ mod tests {
             assert_eq!(output, expect);
         }
     }
+
+    #[test]
+    fn test_parse_128_decimal_number() {
+        let number = "1.23456e10";
+        parse_decimal_128(number, false).unwrap();
+    }
 }
diff --git a/datafusion/sqllogictest/test_files/options.slt b/datafusion/sqllogictest/test_files/options.slt
@@ -206,6 +206,18 @@ select 123456789.0123456789012345678901234567890
 statement error SQL error: ParserError\("Cannot parse 1234567890123456789012345678901234567890 as i128 when building decimal: number too large to fit in target type"\)
 select -123456789.0123456789012345678901234567890
 
+# scientific notation
+query RRRR
+select 1.234e2, 1.234e-2, -1.234e2, -1.234e-2
+----
+123.4 0.01234 -123.4 -0.01234
+
+statement error DataFusion error: SQL error: ParserError\("Cannot parse 1234 as i128 when building decimal: precision overflow"\)
+select 1.234e-38
+
+statement error DataFusion error: SQL error: ParserError\("Cannot parse 1234 as i128 when building decimal: precision overflow"\)
+select 1.234e+38
+
 # Restore option to default value
 statement ok
 set datafusion.sql_parser.parse_float_as_decimal = false;