apache · allisonwang-db · Dec 11, 2025 · cloud-fan · Dec 11, 2025 · pan3793
diff --git a/sql/catalyst/src/main/scala/org/apache/spark/sql/catalyst/analysis/Analyzer.scala b/sql/catalyst/src/main/scala/org/apache/spark/sql/catalyst/analysis/Analyzer.scala
@@ -2394,10 +2394,13 @@ class Analyzer(
   object ResolveProcedures extends Rule[LogicalPlan] {
     def apply(plan: LogicalPlan): LogicalPlan = plan.resolveOperatorsWithPruning(
       _.containsPattern(UNRESOLVED_PROCEDURE), ruleId) {
-      case Call(UnresolvedProcedure(CatalogAndIdentifier(catalog, ident)), args, execute) =>
-        val procedureCatalog = catalog.asProcedureCatalog
+      case UnresolvedProcedure(CatalogAndIdentifier(catalog, ident)) =>
+        if (!catalog.isInstanceOf[ProcedureCatalog]) {
+          throw QueryCompilationErrors.missingCatalogProceduresAbilityError(catalog)
+        }
+        val procedureCatalog = catalog.asInstanceOf[ProcedureCatalog]
         val procedure = load(procedureCatalog, ident)
-        Call(ResolvedProcedure(procedureCatalog, ident, procedure), args, execute)
+        ResolvedProcedure(procedureCatalog, ident, procedure)
     }
 
     private def load(catalog: ProcedureCatalog, ident: Identifier): UnboundProcedure = {

diff --git a/sql/core/src/main/scala/org/apache/spark/sql/execution/SparkSqlParser.scala b/sql/core/src/main/scala/org/apache/spark/sql/execution/SparkSqlParser.scala
@@ -29,7 +29,8 @@ import org.apache.spark.SparkException
 import org.apache.spark.sql.catalyst.{FunctionIdentifier, TableIdentifier}
 import org.apache.spark.sql.catalyst.analysis.{CurrentNamespace, GlobalTempView, LocalTempView,
   PersistedView, PlanWithUnresolvedIdentifier, SchemaEvolution, SchemaTypeEvolution,
-  UnresolvedAttribute, UnresolvedFunctionName, UnresolvedIdentifier, UnresolvedNamespace}
+  UnresolvedAttribute, UnresolvedFunctionName, UnresolvedIdentifier, UnresolvedNamespace,
+  UnresolvedProcedure}
 import org.apache.spark.sql.catalyst.catalog._
 import org.apache.spark.sql.catalyst.expressions.{Expression, Literal}
 import org.apache.spark.sql.catalyst.parser._
@@ -1349,7 +1350,7 @@ class SparkSqlAstBuilder extends AstBuilder {
   override def visitDescribeProcedure(
       ctx: DescribeProcedureContext): LogicalPlan = withOrigin(ctx) {
     withIdentClause(ctx.identifierReference(), procIdentifier =>
-      DescribeProcedureCommand(UnresolvedIdentifier(procIdentifier)))
+      DescribeProcedureCommand(UnresolvedProcedure(procIdentifier)))
   }
 
   override def visitCreatePipelineInsertIntoFlow(

diff --git a/...core/src/main/scala/org/apache/spark/sql/execution/command/DescribeProcedureCommand.scala b/...core/src/main/scala/org/apache/spark/sql/execution/command/DescribeProcedureCommand.scala
@@ -19,16 +19,13 @@ package org.apache.spark.sql.execution.command
 
 import scala.collection.mutable.ArrayBuffer
 
-import org.apache.spark.{SparkException, SparkThrowable}
+import org.apache.spark.SparkException
 import org.apache.spark.sql.{Row, SparkSession}
-import org.apache.spark.sql.catalyst.analysis.ResolvedIdentifier
+import org.apache.spark.sql.catalyst.analysis.ResolvedProcedure
 import org.apache.spark.sql.catalyst.expressions.{Attribute, AttributeReference}
 import org.apache.spark.sql.catalyst.plans.logical.LogicalPlan
-import org.apache.spark.sql.connector.catalog.{Identifier, ProcedureCatalog}
-import org.apache.spark.sql.connector.catalog.CatalogV2Implicits._
-import org.apache.spark.sql.connector.catalog.procedures.UnboundProcedure
-import org.apache.spark.sql.errors.QueryCompilationErrors
-import org.apache.spark.sql.types.StringType
+import org.apache.spark.sql.connector.catalog.procedures.{ProcedureParameter, UnboundProcedure}
+import org.apache.spark.sql.types.{StringType, StructType}
 
 /**
  * A command for users to describe a procedure.
@@ -45,34 +42,63 @@ case class DescribeProcedureCommand(
 
   override def run(sparkSession: SparkSession): Seq[Row] = {
     child match {
-      case ResolvedIdentifier(catalog, ident) =>
-        val procedure = load(catalog.asProcedureCatalog, ident)
-        describeV2Procedure(procedure)
+      case ResolvedProcedure(catalog, ident, procedure) =>
+        describeV2Procedure(procedure.asInstanceOf[UnboundProcedure])
       case _ =>
         throw SparkException.internalError(s"Invalid procedure identifier: ${child.getClass}")
     }
   }
 
-  private def load(catalog: ProcedureCatalog, ident: Identifier): UnboundProcedure = {
-    try {
-      catalog.loadProcedure(ident)
-    } catch {
-      case e: Exception if !e.isInstanceOf[SparkThrowable] =>
-        val nameParts = catalog.name +: ident.asMultipartIdentifier
-        throw QueryCompilationErrors.failedToLoadRoutineError(nameParts, e)
-    }
-  }
 
   private def describeV2Procedure(procedure: UnboundProcedure): Seq[Row] = {
     val buffer = new ArrayBuffer[(String, String)]
     append(buffer, "Procedure:", procedure.name())
     append(buffer, "Description:", procedure.description())
 
+    // UnboundProcedure requires binding to retrieve parameters. We try to bind with an empty
+    // argument list to get the parameters. If the procedure requires arguments, binding might
+    // fail. In that case, we suppress the exception and just show the procedure metadata
+    // without parameters.
+    try {
+      val bound = procedure.bind(new StructType())
+      val params = bound.parameters()
+      if (params != null && params.nonEmpty) {
+        val formattedParams = formatProcedureParameters(params)
+        append(buffer, "Parameters:", formattedParams.head)
+        formattedParams.tail.foreach(s => append(buffer, "", s))
+      } else {
+        append(buffer, "Parameters:", "()")
+      }
+    } catch {
+      case _: Exception =>
+        // Ignore if binding fails
+    }
+
     val keys = tabulate(buffer.map(_._1).toSeq)
     val values = buffer.map(_._2)
     keys.zip(values).map { case (key, value) => Row(s"$key $value") }
   }
 
+  // This helper is needed because the V2 Procedure API returns an array of ProcedureParameter,
+  // which differs from the StructType used by internal stored procedures (handled by
+  // formatParameters).
+  private def formatProcedureParameters(params: Array[ProcedureParameter]): Seq[String] = {
+    val modes = tabulate(params.map(_.mode().toString).toSeq)
+    val names = tabulate(params.map(_.name()).toSeq)
+    val dataTypes = tabulate(params.map(_.dataType().sql).toSeq)
+    val comments = params.map { p =>
+      if (p.comment() != null) s" '${p.comment()}'" else ""
+    }
+    val defaults = params.map { p =>
+      val defaultVal = if (p.defaultValue() != null) p.defaultValue().getSql else null
+      if (defaultVal != null) s" DEFAULT $defaultVal" else ""
+    }
+    modes zip names zip dataTypes zip defaults zip comments map {
+      case ((((mode, name), dataType), default), comment) =>
+        s"$mode $name $dataType$default$comment"
+    }
+  }
+
   private def append(buffer: ArrayBuffer[(String, String)], key: String, value: String): Unit = {
     buffer += (key -> value)
   }

diff --git a/sql/core/src/test/scala/org/apache/spark/sql/connector/ProcedureSuite.scala b/sql/core/src/test/scala/org/apache/spark/sql/connector/ProcedureSuite.scala
@@ -512,47 +512,64 @@ class ProcedureSuite extends QueryTest with SharedSparkSession with BeforeAndAft
       checkAnswer(
         sql("DESC PROCEDURE cat.ns.foo"),
         Row("Procedure:   sum") ::
-          Row("Description: sum integers") :: Nil)
+          Row("Description: sum integers") ::
+          Row("Parameters:  IN in1 INT") ::
+          Row("             IN in2 INT") :: Nil)
 
       checkAnswer(
         // use DESCRIBE instead of DESC
         sql("DESCRIBE PROCEDURE cat.ns.foo"),
         Row("Procedure:   sum") ::
-          Row("Description: sum integers") :: Nil)
+          Row("Description: sum integers") ::
+          Row("Parameters:  IN in1 INT") ::
+          Row("             IN in2 INT") :: Nil)
 
       checkAnswer(
         // use default catalog
         sql("DESC PROCEDURE ns.foo"),
         Row("Procedure:   sum") ::
-          Row("Description: sum integers") :: Nil)
+          Row("Description: sum integers") ::
+          Row("Parameters:  IN in1 INT") ::
+          Row("             IN in2 INT") :: Nil)
 
       checkAnswer(
         // use multi-part namespace
         sql("DESCRIBE PROCEDURE cat.ns.db.abc"),
         Row("Procedure:   long_sum") ::
-          Row("Description: sum longs") :: Nil)
+          Row("Description: sum longs") ::
+          Row("Parameters:  IN in1 BIGINT") ::
+          Row("             IN in2 BIGINT") :: Nil)
 
       checkAnswer(
         // use multi-part namespace with default catalog
         sql("DESCRIBE PROCEDURE ns.db.abc"),
         Row("Procedure:   long_sum") ::
-          Row("Description: sum longs") :: Nil)
+          Row("Description: sum longs") ::
+          Row("Parameters:  IN in1 BIGINT") ::
+          Row("             IN in2 BIGINT") :: Nil)
 
       checkAnswer(
         sql("DESC PROCEDURE cat.``.xyz"),
         Row("Procedure:   complex") ::
-          Row("Description: complex procedure") :: Nil)
+          Row("Description: complex procedure") ::
+          Row("Parameters:  IN in1 STRING DEFAULT 'A'") ::
+          Row("             IN in2 STRING DEFAULT 'B'") ::
+          Row("             IN in3 INT    DEFAULT 1 + 1 - 1") :: Nil)
 
       checkAnswer(
         sql("DESC PROCEDURE cat.xxx"),
         Row("Procedure:   struct_input") ::
-          Row("Description: struct procedure") :: Nil)
+          Row("Description: struct procedure") ::
+          Row("Parameters:  IN in1 STRUCT<nested1: INT, nested2: STRING>") ::
+          Row("             IN in2 STRING                               ") :: Nil)
 
       checkAnswer(
         // check across catalogs
         sql("DESC PROCEDURE cat2.ns_1.db_1.foo"),
         Row("Procedure:   void") ::
-          Row("Description: void procedure") :: Nil)
+          Row("Description: void procedure") ::
+          Row("Parameters:  IN in1 STRING") ::
+          Row("             IN in2 STRING") :: Nil)
     }
   }