Introduce NullSafeHashPartitioning and NullUnsafePartitioning.

yhuai · yhuai · commit 69bb0724eb1d · 2015-07-27T14:15:35.000-07:00
diff --git a/sql/catalyst/src/main/scala/org/apache/spark/sql/catalyst/expressions/misc.scala b/sql/catalyst/src/main/scala/org/apache/spark/sql/catalyst/expressions/misc.scala
@@ -21,6 +21,7 @@ import java.security.{MessageDigest, NoSuchAlgorithmException}
 import java.util.zip.CRC32
 
 import org.apache.commons.codec.digest.DigestUtils
+import org.apache.spark.sql.catalyst.InternalRow
 
 import org.apache.spark.sql.catalyst.expressions.codegen._
 import org.apache.spark.sql.types._
@@ -160,3 +161,22 @@ case class Crc32(child: Expression) extends UnaryExpression with ImplicitCastInp
     })
   }
 }
+
+/** An expression that returns the hashCode of the input row. */
+case object RowHashCode extends LeafExpression {
+  override def dataType: DataType = IntegerType
+
+  /** hashCode will never be null. */
+  override def nullable: Boolean = false
+
+  override def eval(input: InternalRow): Any = {
+    input.hashCode
+  }
+
+  override def genCode(ctx: CodeGenContext, ev: GeneratedExpressionCode): String = {
+    s"""
+        boolean ${ev.isNull} = false;
+        ${ctx.javaType(dataType)} ${ev.primitive} = i.hashCode();
+    """
+  }
+}
diff --git a/sql/catalyst/src/main/scala/org/apache/spark/sql/catalyst/plans/physical/partitioning.scala b/sql/catalyst/src/main/scala/org/apache/spark/sql/catalyst/plans/physical/partitioning.scala
@@ -47,9 +47,23 @@ case object AllTuples extends Distribution
  * Represents data where tuples that share the same values for the `clustering`
  * [[Expression Expressions]] will be co-located. Based on the context, this
  * can mean such tuples are either co-located in the same partition or they will be contiguous
- * within a single partition.
+ * within a single partition. For two null values in two rows evaluated by `clustering`,
+ * we consider these two nulls are equal.
  */
-case class ClusteredDistribution(clustering: Seq[Expression]) extends Distribution {
+case class NullSafeClusteredDistribution(clustering: Seq[Expression]) extends Distribution {
+  require(
+    clustering != Nil,
+    "The clustering expressions of a ClusteredDistribution should not be Nil. " +
+      "An AllTuples should be used to represent a distribution that only has " +
+      "a single partition.")
+}
+
+/**
+ * It is basically the same as [[NullSafeClusteredDistribution]] except that
+ * for two null values in two rows evaluated by `clustering`,
+ * we consider these two nulls are not equal.
+ */
+case class NullUnsafeClusteredDistribution(clustering: Seq[Expression]) extends Distribution {
   require(
     clustering != Nil,
     "The clustering expressions of a ClusteredDistribution should not be Nil. " +
@@ -60,7 +74,7 @@ case class ClusteredDistribution(clustering: Seq[Expression]) extends Distributi
 /**
  * Represents data where tuples have been ordered according to the `ordering`
  * [[Expression Expressions]].  This is a strictly stronger guarantee than
- * [[ClusteredDistribution]] as an ordering will ensure that tuples that share the same value for
+ * [[NullSafeClusteredDistribution]] as an ordering will ensure that tuples that share the same value for
  * the ordering expressions are contiguous and will never be split across partitions.
  */
 case class OrderedDistribution(ordering: Seq[SortOrder]) extends Distribution {
@@ -89,7 +103,7 @@ sealed trait Partitioning {
   /**
    * Returns true iff all distribution guarantees made by this partitioning can also be made
    * for the `other` specified partitioning.
-   * For example, two [[HashPartitioning HashPartitioning]]s are
+   * For example, two [[NullSafeHashPartitioning HashPartitioning]]s are
    * only compatible if the `numPartitions` of them is the same.
    */
   def compatibleWith(other: Partitioning): Boolean
@@ -143,7 +157,34 @@ case object BroadcastPartitioning extends Partitioning {
  * of `expressions`.  All rows where `expressions` evaluate to the same values are guaranteed to be
  * in the same partition.
  */
-case class HashPartitioning(expressions: Seq[Expression], numPartitions: Int)
+case class NullSafeHashPartitioning(expressions: Seq[Expression], numPartitions: Int)
+  extends Expression with Partitioning with Unevaluable {
+
+  override def children: Seq[Expression] = expressions
+  override def nullable: Boolean = false
+  override def dataType: DataType = IntegerType
+
+  private[this] lazy val clusteringSet = expressions.toSet
+
+  override def satisfies(required: Distribution): Boolean = required match {
+    case UnspecifiedDistribution => true
+    case NullSafeClusteredDistribution(requiredClustering) =>
+      clusteringSet.subsetOf(requiredClustering.toSet)
+    case NullUnsafeClusteredDistribution(requiredClustering) =>
+      clusteringSet.subsetOf(requiredClustering.toSet)
+    case _ => false
+  }
+
+  override def compatibleWith(other: Partitioning): Boolean = other match {
+    case BroadcastPartitioning => true
+    case h: NullSafeHashPartitioning if h == this => true
+    case _ => false
+  }
+
+  override def keyExpressions: Seq[Expression] = expressions
+}
+
+case class NullUnsafeHashPartitioning(expressions: Seq[Expression], numPartitions: Int)
   extends Expression with Partitioning with Unevaluable {
 
   override def children: Seq[Expression] = expressions
@@ -154,14 +195,14 @@ case class HashPartitioning(expressions: Seq[Expression], numPartitions: Int)
 
   override def satisfies(required: Distribution): Boolean = required match {
     case UnspecifiedDistribution => true
-    case ClusteredDistribution(requiredClustering) =>
+    case NullUnsafeClusteredDistribution(requiredClustering) =>
       clusteringSet.subsetOf(requiredClustering.toSet)
     case _ => false
   }
 
   override def compatibleWith(other: Partitioning): Boolean = other match {
     case BroadcastPartitioning => true
-    case h: HashPartitioning if h == this => true
+    case h: NullUnsafeHashPartitioning if h == this => true
     case _ => false
   }
 
@@ -194,14 +235,13 @@ case class RangePartitioning(ordering: Seq[SortOrder], numPartitions: Int)
     case OrderedDistribution(requiredOrdering) =>
       val minSize = Seq(requiredOrdering.size, ordering.size).min
       requiredOrdering.take(minSize) == ordering.take(minSize)
-    case ClusteredDistribution(requiredClustering) =>
+    case NullSafeClusteredDistribution(requiredClustering) =>
       clusteringSet.subsetOf(requiredClustering.toSet)
     case _ => false
   }
 
   override def compatibleWith(other: Partitioning): Boolean = other match {
     case BroadcastPartitioning => true
-    case r: RangePartitioning if r == this => true
     case _ => false
   }
 
diff --git a/sql/catalyst/src/test/scala/org/apache/spark/sql/catalyst/DistributionSuite.scala b/sql/catalyst/src/test/scala/org/apache/spark/sql/catalyst/DistributionSuite.scala
@@ -45,23 +45,23 @@ class DistributionSuite extends SparkFunSuite {
   test("HashPartitioning is the output partitioning") {
     // Cases which do not need an exchange between two data properties.
     checkSatisfied(
-      HashPartitioning(Seq('a, 'b, 'c), 10),
+      NullSafeHashPartitioning(Seq('a, 'b, 'c), 10),
       UnspecifiedDistribution,
       true)
 
     checkSatisfied(
-      HashPartitioning(Seq('a, 'b, 'c), 10),
-      ClusteredDistribution(Seq('a, 'b, 'c)),
+      NullSafeHashPartitioning(Seq('a, 'b, 'c), 10),
+      NullSafeClusteredDistribution(Seq('a, 'b, 'c)),
       true)
 
     checkSatisfied(
-      HashPartitioning(Seq('b, 'c), 10),
-      ClusteredDistribution(Seq('a, 'b, 'c)),
+      NullSafeHashPartitioning(Seq('b, 'c), 10),
+      NullSafeClusteredDistribution(Seq('a, 'b, 'c)),
       true)
 
     checkSatisfied(
       SinglePartition,
-      ClusteredDistribution(Seq('a, 'b, 'c)),
+      NullSafeClusteredDistribution(Seq('a, 'b, 'c)),
       true)
 
     checkSatisfied(
@@ -71,27 +71,27 @@ class DistributionSuite extends SparkFunSuite {
 
     // Cases which need an exchange between two data properties.
     checkSatisfied(
-      HashPartitioning(Seq('a, 'b, 'c), 10),
-      ClusteredDistribution(Seq('b, 'c)),
+      NullSafeHashPartitioning(Seq('a, 'b, 'c), 10),
+      NullSafeClusteredDistribution(Seq('b, 'c)),
       false)
 
     checkSatisfied(
-      HashPartitioning(Seq('a, 'b, 'c), 10),
-      ClusteredDistribution(Seq('d, 'e)),
+      NullSafeHashPartitioning(Seq('a, 'b, 'c), 10),
+      NullSafeClusteredDistribution(Seq('d, 'e)),
       false)
 
     checkSatisfied(
-      HashPartitioning(Seq('a, 'b, 'c), 10),
+      NullSafeHashPartitioning(Seq('a, 'b, 'c), 10),
       AllTuples,
       false)
 
     checkSatisfied(
-      HashPartitioning(Seq('a, 'b, 'c), 10),
+      NullSafeHashPartitioning(Seq('a, 'b, 'c), 10),
       OrderedDistribution(Seq('a.asc, 'b.asc, 'c.asc)),
       false)
 
     checkSatisfied(
-      HashPartitioning(Seq('b, 'c), 10),
+      NullSafeHashPartitioning(Seq('b, 'c), 10),
       OrderedDistribution(Seq('a.asc, 'b.asc, 'c.asc)),
       false)
 
@@ -128,17 +128,17 @@ class DistributionSuite extends SparkFunSuite {
 
     checkSatisfied(
       RangePartitioning(Seq('a.asc, 'b.asc, 'c.asc), 10),
-      ClusteredDistribution(Seq('a, 'b, 'c)),
+      NullSafeClusteredDistribution(Seq('a, 'b, 'c)),
       true)
 
     checkSatisfied(
       RangePartitioning(Seq('a.asc, 'b.asc, 'c.asc), 10),
-      ClusteredDistribution(Seq('c, 'b, 'a)),
+      NullSafeClusteredDistribution(Seq('c, 'b, 'a)),
       true)
 
     checkSatisfied(
       RangePartitioning(Seq('a.asc, 'b.asc, 'c.asc), 10),
-      ClusteredDistribution(Seq('b, 'c, 'a, 'd)),
+      NullSafeClusteredDistribution(Seq('b, 'c, 'a, 'd)),
       true)
 
     // Cases which need an exchange between two data properties.
@@ -158,12 +158,12 @@ class DistributionSuite extends SparkFunSuite {
 
     checkSatisfied(
       RangePartitioning(Seq('a.asc, 'b.asc, 'c.asc), 10),
-      ClusteredDistribution(Seq('a, 'b)),
+      NullSafeClusteredDistribution(Seq('a, 'b)),
       false)
 
     checkSatisfied(
       RangePartitioning(Seq('a.asc, 'b.asc, 'c.asc), 10),
-      ClusteredDistribution(Seq('c, 'd)),
+      NullSafeClusteredDistribution(Seq('c, 'd)),
       false)
 
     checkSatisfied(
diff --git a/sql/core/src/main/scala/org/apache/spark/sql/execution/Aggregate.scala b/sql/core/src/main/scala/org/apache/spark/sql/execution/Aggregate.scala
@@ -52,7 +52,7 @@ case class Aggregate(
       if (groupingExpressions == Nil) {
         AllTuples :: Nil
       } else {
-        ClusteredDistribution(groupingExpressions) :: Nil
+        NullSafeClusteredDistribution(groupingExpressions) :: Nil
       }
     }
   }
diff --git a/sql/core/src/main/scala/org/apache/spark/sql/execution/Exchange.scala b/sql/core/src/main/scala/org/apache/spark/sql/execution/Exchange.scala
@@ -29,6 +29,7 @@ import org.apache.spark.sql.catalyst.errors.attachTree
 import org.apache.spark.sql.catalyst.expressions._
 import org.apache.spark.sql.catalyst.plans.physical._
 import org.apache.spark.sql.catalyst.rules.Rule
+import org.apache.spark.sql.types.IntegerType
 import org.apache.spark.util.MutablePair
 import org.apache.spark.{HashPartitioner, Partitioner, RangePartitioner, SparkEnv}
 
@@ -140,10 +141,13 @@ case class Exchange(newPartitioning: Partitioning, child: SparkPlan) extends Una
     }
   }
 
+  private val advancedSqlOptimizations = child.sqlContext.conf.advancedSqlOptimizations
+
   protected override def doExecute(): RDD[InternalRow] = attachTree(this , "execute") {
     val rdd = child.execute()
     val part: Partitioner = newPartitioning match {
-      case HashPartitioning(expressions, numPartitions) => new HashPartitioner(numPartitions)
+      case NullSafeHashPartitioning(expressions, numPartitions) => new HashPartitioner(numPartitions)
+      case NullUnsafeHashPartitioning(expressions, numPartitions) => new HashPartitioner(numPartitions)
       case RangePartitioning(sortingExpressions, numPartitions) =>
         // Internally, RangePartitioner runs a job on the RDD that samples keys to compute
         // partition bounds. To get accurate samples, we need to copy the mutable keys.
@@ -162,7 +166,24 @@ case class Exchange(newPartitioning: Partitioning, child: SparkPlan) extends Una
       // TODO: Handle BroadcastPartitioning.
     }
     def getPartitionKeyExtractor(): InternalRow => InternalRow = newPartitioning match {
-      case HashPartitioning(expressions, _) => newMutableProjection(expressions, child.output)()
+      case NullSafeHashPartitioning(expressions, _) => newMutableProjection(expressions, child.output)()
+      case NullUnsafeHashPartitioning(expressions, numPartition) if advancedSqlOptimizations =>
+        // For NullUnsafeHashPartitioning, we do not want to send rows having any expression
+        // in `expressions` evaluated as null to the same node.
+        val materalizeExpressions = newMutableProjection(expressions, child.output)()
+        val partitionExpressionSchema = expressions.map { expr =>
+          Alias(expr, "partitionExpr")().toAttribute
+        }
+        val partitionId =
+          If(
+            AtLeastNNonNulls(partitionExpressionSchema.length, partitionExpressionSchema),
+            RowHashCode,
+            Cast(Multiply(new Rand(numPartition), Literal(numPartition.toDouble)), IntegerType))
+        val partitionIdExtractor =
+          newMutableProjection(partitionId :: Nil, partitionExpressionSchema)()
+        (row: InternalRow) => partitionIdExtractor(materalizeExpressions(row))
+      case NullUnsafeHashPartitioning(expressions, numPartition) =>
+        newMutableProjection(expressions, child.output)()
       case RangePartitioning(_, _) | SinglePartition => identity
       case _ => sys.error(s"Exchange not implemented for $newPartitioning")
     }
@@ -276,8 +297,10 @@ private[sql] case class EnsureRequirements(sqlContext: SQLContext) extends Rule[
         val fixedChildren = requirements.zipped.map {
           case (AllTuples, rowOrdering, child) =>
             addOperatorsIfNecessary(SinglePartition, rowOrdering, child)
-          case (ClusteredDistribution(clustering), rowOrdering, child) =>
-            addOperatorsIfNecessary(HashPartitioning(clustering, numPartitions), rowOrdering, child)
+          case (NullSafeClusteredDistribution(clustering), rowOrdering, child) =>
+            addOperatorsIfNecessary(NullSafeHashPartitioning(clustering, numPartitions), rowOrdering, child)
+          case (NullUnsafeClusteredDistribution(clustering), rowOrdering, child) =>
+            addOperatorsIfNecessary(NullUnsafeHashPartitioning(clustering, numPartitions), rowOrdering, child)
           case (OrderedDistribution(ordering), rowOrdering, child) =>
             addOperatorsIfNecessary(RangePartitioning(ordering, numPartitions), rowOrdering, child)
 
diff --git a/sql/core/src/main/scala/org/apache/spark/sql/execution/GeneratedAggregate.scala b/sql/core/src/main/scala/org/apache/spark/sql/execution/GeneratedAggregate.scala
@@ -61,7 +61,7 @@ case class GeneratedAggregate(
       if (groupingExpressions == Nil) {
         AllTuples :: Nil
       } else {
-        ClusteredDistribution(groupingExpressions) :: Nil
+        NullSafeClusteredDistribution(groupingExpressions) :: Nil
       }
     }
 
diff --git a/sql/core/src/main/scala/org/apache/spark/sql/execution/SparkStrategies.scala b/sql/core/src/main/scala/org/apache/spark/sql/execution/SparkStrategies.scala
@@ -403,7 +403,7 @@ private[sql] abstract class SparkStrategies extends QueryPlanner[SparkPlan] {
       case logical.OneRowRelation =>
         execution.PhysicalRDD(Nil, singleRowRdd) :: Nil
       case logical.RepartitionByExpression(expressions, child) =>
-        execution.Exchange(HashPartitioning(expressions, numPartitions), planLater(child)) :: Nil
+        execution.Exchange(NullSafeHashPartitioning(expressions, numPartitions), planLater(child)) :: Nil
       case e @ EvaluatePython(udf, child, _) =>
         BatchPythonEvaluation(udf, e.output, planLater(child)) :: Nil
       case LogicalRDD(output, rdd) => PhysicalRDD(output, rdd) :: Nil
diff --git a/sql/core/src/main/scala/org/apache/spark/sql/execution/Window.scala b/sql/core/src/main/scala/org/apache/spark/sql/execution/Window.scala
@@ -92,7 +92,7 @@ case class Window(
       logWarning("No Partition Defined for Window operation! Moving all data to a single "
         + "partition, this can cause serious performance degradation.")
       AllTuples :: Nil
-    } else ClusteredDistribution(windowSpec.partitionSpec) :: Nil
+    } else NullSafeClusteredDistribution(windowSpec.partitionSpec) :: Nil
   }
 
   override def requiredChildOrdering: Seq[Seq[SortOrder]] =
diff --git a/sql/core/src/main/scala/org/apache/spark/sql/execution/aggregate/aggregateOperators.scala b/sql/core/src/main/scala/org/apache/spark/sql/execution/aggregate/aggregateOperators.scala
@@ -22,7 +22,7 @@ import org.apache.spark.sql.catalyst.InternalRow
 import org.apache.spark.sql.catalyst.errors._
 import org.apache.spark.sql.catalyst.expressions._
 import org.apache.spark.sql.catalyst.expressions.aggregate._
-import org.apache.spark.sql.catalyst.plans.physical.{AllTuples, ClusteredDistribution, Distribution, UnspecifiedDistribution}
+import org.apache.spark.sql.catalyst.plans.physical.{AllTuples, NullSafeClusteredDistribution, Distribution, UnspecifiedDistribution}
 import org.apache.spark.sql.execution.{SparkPlan, UnaryNode}
 
 case class Aggregate2Sort(
@@ -49,7 +49,7 @@ case class Aggregate2Sort(
   override def requiredChildDistribution: List[Distribution] = {
     requiredChildDistributionExpressions match {
       case Some(exprs) if exprs.length == 0 => AllTuples :: Nil
-      case Some(exprs) if exprs.length > 0 => ClusteredDistribution(exprs) :: Nil
+      case Some(exprs) if exprs.length > 0 => NullSafeClusteredDistribution(exprs) :: Nil
       case None => UnspecifiedDistribution :: Nil
     }
   }
@@ -144,7 +144,7 @@ case class FinalAndCompleteAggregate2Sort(
     if (groupingExpressions.isEmpty) {
       AllTuples :: Nil
     } else {
-      ClusteredDistribution(groupingExpressions) :: Nil
+      NullSafeClusteredDistribution(groupingExpressions) :: Nil
     }
   }
 
diff --git a/sql/core/src/main/scala/org/apache/spark/sql/execution/joins/LeftSemiJoinHash.scala b/sql/core/src/main/scala/org/apache/spark/sql/execution/joins/LeftSemiJoinHash.scala
@@ -21,7 +21,7 @@ import org.apache.spark.annotation.DeveloperApi
 import org.apache.spark.rdd.RDD
 import org.apache.spark.sql.catalyst.InternalRow
 import org.apache.spark.sql.catalyst.expressions._
-import org.apache.spark.sql.catalyst.plans.physical.ClusteredDistribution
+import org.apache.spark.sql.catalyst.plans.physical.{Distribution, NullUnsafeClusteredDistribution, NullSafeClusteredDistribution}
 import org.apache.spark.sql.execution.{BinaryNode, SparkPlan}
 
 /**
@@ -37,8 +37,8 @@ case class LeftSemiJoinHash(
     right: SparkPlan,
     condition: Option[Expression]) extends BinaryNode with HashSemiJoin {
 
-  override def requiredChildDistribution: Seq[ClusteredDistribution] =
-    ClusteredDistribution(leftKeys) :: ClusteredDistribution(rightKeys) :: Nil
+  override def requiredChildDistribution: Seq[Distribution] =
+    NullUnsafeClusteredDistribution(leftKeys) :: NullUnsafeClusteredDistribution(rightKeys) :: Nil
 
   protected override def doExecute(): RDD[InternalRow] = {
     right.execute().zipPartitions(left.execute()) { (buildIter, streamIter) =>
diff --git a/sql/core/src/main/scala/org/apache/spark/sql/execution/joins/ShuffledHashJoin.scala b/sql/core/src/main/scala/org/apache/spark/sql/execution/joins/ShuffledHashJoin.scala
diff --git a/sql/core/src/main/scala/org/apache/spark/sql/execution/joins/ShuffledHashOuterJoin.scala b/sql/core/src/main/scala/org/apache/spark/sql/execution/joins/ShuffledHashOuterJoin.scala
diff --git a/sql/core/src/main/scala/org/apache/spark/sql/execution/joins/SortMergeJoin.scala b/sql/core/src/main/scala/org/apache/spark/sql/execution/joins/SortMergeJoin.scala

Original file line number	Diff line number	Diff line change
`@@ -52,7 +52,7 @@ case class Aggregate(`
`52`	`52`	`if (groupingExpressions == Nil) {`
`53`	`53`	`AllTuples :: Nil`
`54`	`54`	`} else {`
`55`		`- ClusteredDistribution(groupingExpressions) :: Nil`
	`55`	`+ NullSafeClusteredDistribution(groupingExpressions) :: Nil`
`56`	`56`	`}`
`57`	`57`	`}`
`58`	`58`	`}`
Original file line number	Diff line number	Diff line change
`@@ -61,7 +61,7 @@ case class GeneratedAggregate(`
`61`	`61`	`if (groupingExpressions == Nil) {`
`62`	`62`	`AllTuples :: Nil`
`63`	`63`	`} else {`
`64`		`- ClusteredDistribution(groupingExpressions) :: Nil`
	`64`	`+ NullSafeClusteredDistribution(groupingExpressions) :: Nil`
`65`	`65`	`}`
`66`	`66`	`}`
`67`	`67`
Original file line number	Diff line number	Diff line change
`@@ -92,7 +92,7 @@ case class Window(`
`92`	`92`	`logWarning("No Partition Defined for Window operation! Moving all data to a single "`
`93`	`93`	`+ "partition, this can cause serious performance degradation.")`
`94`	`94`	`AllTuples :: Nil`
`95`		`- } else ClusteredDistribution(windowSpec.partitionSpec) :: Nil`
	`95`	`+ } else NullSafeClusteredDistribution(windowSpec.partitionSpec) :: Nil`
`96`	`96`	`}`
`97`	`97`
`98`	`98`	`override def requiredChildOrdering: Seq[Seq[SortOrder]] =`
Original file line number	Diff line number	Diff line change
`@@ -22,7 +22,7 @@ import org.apache.spark.sql.catalyst.InternalRow`
`22`	`22`	`import org.apache.spark.sql.catalyst.errors._`
`23`	`23`	`import org.apache.spark.sql.catalyst.expressions._`
`24`	`24`	`import org.apache.spark.sql.catalyst.expressions.aggregate._`
`25`		`-import org.apache.spark.sql.catalyst.plans.physical.{AllTuples, ClusteredDistribution, Distribution, UnspecifiedDistribution}`
	`25`	`+import org.apache.spark.sql.catalyst.plans.physical.{AllTuples, NullSafeClusteredDistribution, Distribution, UnspecifiedDistribution}`
`26`	`26`	`import org.apache.spark.sql.execution.{SparkPlan, UnaryNode}`
`27`	`27`
`28`	`28`	`case class Aggregate2Sort(`
`@@ -49,7 +49,7 @@ case class Aggregate2Sort(`
`49`	`49`	`override def requiredChildDistribution: List[Distribution] = {`
`50`	`50`	`requiredChildDistributionExpressions match {`
`51`	`51`	`case Some(exprs) if exprs.length == 0 => AllTuples :: Nil`
`52`		`- case Some(exprs) if exprs.length > 0 => ClusteredDistribution(exprs) :: Nil`
	`52`	`+ case Some(exprs) if exprs.length > 0 => NullSafeClusteredDistribution(exprs) :: Nil`
`53`	`53`	`case None => UnspecifiedDistribution :: Nil`
`54`	`54`	`}`
`55`	`55`	`}`
`@@ -144,7 +144,7 @@ case class FinalAndCompleteAggregate2Sort(`
`144`	`144`	`if (groupingExpressions.isEmpty) {`
`145`	`145`	`AllTuples :: Nil`
`146`	`146`	`} else {`
`147`		`- ClusteredDistribution(groupingExpressions) :: Nil`
	`147`	`+ NullSafeClusteredDistribution(groupingExpressions) :: Nil`
`148`	`148`	`}`
`149`	`149`	`}`
`150`	`150`