apache · amaliujia · Oct 22, 2022 · Oct 31, 2022 · cloud-fan · Oct 24, 2022
diff --git a/connector/connect/src/main/protobuf/spark/connect/relations.proto b/connector/connect/src/main/protobuf/spark/connect/relations.proto
@@ -44,6 +44,7 @@ message Relation {
     Sample sample = 12;
     Offset offset = 13;
     Deduplicate deduplicate = 14;
+    Range range = 15;
 
     Unknown unknown = 999;
   }
@@ -217,3 +218,23 @@ message Sample {
     int64 seed = 1;
   }
 }
+
+// Relation of type [[Range]] that generates a sequence of integers.
+message Range {
+  // Optional. Default value = 0
+  int32 start = 1;
+  int32 end = 2;
+  // Optional. Default value = 1
+  Step step = 3;
+  // Optional. Default value is assigned by 1) SQL conf "spark.sql.leafNodeDefaultParallelism" if
+  // it is set, or 2) spark default parallelism.
+  NumPartitions num_partitions = 4;
+
+  message Step {
+    int32 step = 1;
+  }
+
+  message NumPartitions {
+    int32 num_partitions = 1;
+  }
+}
diff --git a/connector/connect/src/main/scala/org/apache/spark/sql/connect/dsl/package.scala b/connector/connect/src/main/scala/org/apache/spark/sql/connect/dsl/package.scala
@@ -19,6 +19,7 @@ package org.apache.spark.sql.connect
 import scala.collection.JavaConverters._
 import scala.language.implicitConversions
 
+import org.apache.spark.connect.proto
 import org.apache.spark.connect.proto._
 import org.apache.spark.connect.proto.Join.JoinType
 import org.apache.spark.connect.proto.SetOperation.SetOpType
@@ -34,6 +35,8 @@ import org.apache.spark.sql.connect.planner.DataTypeProtoConverter
 
 package object dsl {
 
+  class MockRemoteSession {}
+
   object expressions { // scalastyle:ignore
     implicit class DslString(val s: String) {
       def protoAttr: Expression =
@@ -175,6 +178,28 @@ package object dsl {
   }
 
   object plans { // scalastyle:ignore
+    implicit class DslMockRemoteSession(val session: MockRemoteSession) {
+      def range(
+          start: Option[Int],
+          end: Int,
+          step: Option[Int],
+          numPartitions: Option[Int]): Relation = {
+        val range = proto.Range.newBuilder()
 package org.apache.spark.sql.connect 
 package org.apache.spark.sql.connect 
+        if (start.isDefined) {
+          range.setStart(start.get)
+        }
+        range.setEnd(end)
+        if (step.isDefined) {
+          range.setStep(proto.Range.Step.newBuilder().setStep(step.get))
+        }
+        if (numPartitions.isDefined) {
+          range.setNumPartitions(
+            proto.Range.NumPartitions.newBuilder().setNumPartitions(numPartitions.get))
+        }
+        Relation.newBuilder().setRange(range).build()
+      }
+    }
+
     implicit class DslLogicalPlan(val logicalPlan: Relation) {
       def select(exprs: Expression*): Relation = {
         Relation

diff --git a/...tor/connect/src/main/scala/org/apache/spark/sql/connect/planner/SparkConnectPlanner.scala b/...tor/connect/src/main/scala/org/apache/spark/sql/connect/planner/SparkConnectPlanner.scala
@@ -68,6 +68,7 @@ class SparkConnectPlanner(plan: proto.Relation, session: SparkSession) {
       case proto.Relation.RelTypeCase.LOCAL_RELATION =>
         transformLocalRelation(rel.getLocalRelation, common)
       case proto.Relation.RelTypeCase.SAMPLE => transformSample(rel.getSample)
+      case proto.Relation.RelTypeCase.RANGE => transformRange(rel.getRange)
       case proto.Relation.RelTypeCase.RELTYPE_NOT_SET =>
         throw new IndexOutOfBoundsException("Expected Relation to be set, but is empty.")
       case _ => throw InvalidPlanInput(s"${rel.getUnknown} not supported.")
@@ -93,6 +94,22 @@ class SparkConnectPlanner(plan: proto.Relation, session: SparkSession) {
       transformRelation(rel.getInput))
   }
 
+  private def transformRange(rel: proto.Range): LogicalPlan = {
+    val start = rel.getStart
+    val end = rel.getEnd
+    val step = if (rel.hasStep) {
+      rel.getStep.getStep
+    } else {
+      1
+    }
+    val numPartitions = if (rel.hasNumPartitions) {
+      rel.getNumPartitions.getNumPartitions
+    } else {
+      session.leafNodeDefaultParallelism
+    }
+    logical.Range(start, end, step, numPartitions)
+  }
+
   private def transformDeduplicate(rel: proto.Deduplicate): LogicalPlan = {
     if (!rel.hasInput) {
       throw InvalidPlanInput("Deduplicate needs a plan input")

diff --git a/.../connect/src/test/scala/org/apache/spark/sql/connect/planner/SparkConnectProtoSuite.scala b/.../connect/src/test/scala/org/apache/spark/sql/connect/planner/SparkConnectProtoSuite.scala
@@ -24,6 +24,7 @@ import org.apache.spark.sql.catalyst.expressions.AttributeReference
 import org.apache.spark.sql.catalyst.plans.{FullOuter, Inner, LeftAnti, LeftOuter, LeftSemi, PlanTest, RightOuter}
 import org.apache.spark.sql.catalyst.plans.logical.LocalRelation
 import org.apache.spark.sql.catalyst.plans.logical.LogicalPlan
+import org.apache.spark.sql.connect.dsl.MockRemoteSession
 import org.apache.spark.sql.connect.dsl.expressions._
 import org.apache.spark.sql.connect.dsl.plans._
 import org.apache.spark.sql.internal.SQLConf
@@ -35,6 +36,7 @@ import org.apache.spark.sql.types.{IntegerType, StringType, StructField, StructT
  * same as Spark dataframe's generated plan.
  */
 class SparkConnectProtoSuite extends PlanTest with SparkConnectPlanTest {
+  lazy val connect = new MockRemoteSession()
 
   lazy val connectTestRelation =
     createLocalRelationProto(
@@ -209,6 +211,15 @@ class SparkConnectProtoSuite extends PlanTest with SparkConnectPlanTest {
     comparePlans(connectPlan8, sparkPlan8)
   }
 
+  test("Test Range") {
+    comparePlans(connect.range(None, 10, None, None), spark.range(10).toDF())
+    comparePlans(connect.range(Some(2), 10, None, None), spark.range(2, 10).toDF())
+    comparePlans(connect.range(Some(2), 10, Some(10), None), spark.range(2, 10, 10).toDF())
+    comparePlans(
+      connect.range(Some(2), 10, Some(10), Some(100)),
+      spark.range(2, 10, 10, 100).toDF())
+  }
+
   private def createLocalRelationProtoByQualifiedAttributes(
       attrs: Seq[proto.Expression.QualifiedAttribute]): proto.Relation = {
     val localRelationBuilder = proto.LocalRelation.newBuilder()
@@ -226,6 +237,7 @@ class SparkConnectProtoSuite extends PlanTest with SparkConnectPlanTest {
     connectAnalyzed
   }
 
+  // Compares proto plan with DataFrame.
   private def comparePlans(connectPlan: proto.Relation, sparkPlan: DataFrame): Unit = {
     val connectAnalyzed = analyzePlan(transform(connectPlan))
     comparePlans(connectAnalyzed, sparkPlan.queryExecution.analyzed, false)