apache · CurtHagenlocher · Aug 8, 2025 · Jul 29, 2025 · Jul 29, 2025 · Jul 29, 2025
@@ -16,20 +16,18 @@
 */
 
 using System;
-using Apache.Arrow.Adbc.Drivers.Apache;
 using Apache.Arrow.Adbc.Tracing;
 
 namespace Apache.Arrow.Adbc.Drivers.Databricks
 {
     /// <summary>
-    /// Base class for Databricks readers that handles common functionality. Handles the operation status poller.
+    /// Base class for Databricks readers that handles common functionality of DatabricksReader and CloudFetchReader
     /// </summary>
     internal abstract class BaseDatabricksReader : TracingReader
     {
         protected DatabricksStatement statement;
         protected readonly Schema schema;
         protected readonly bool isLz4Compressed;
-        protected DatabricksOperationStatusPoller? operationStatusPoller;
         protected bool hasNoMoreRows = false;
         private bool isDisposed;
 
@@ -39,48 +37,14 @@ protected BaseDatabricksReader(DatabricksStatement statement, Schema schema, boo
             this.schema = schema;
             this.isLz4Compressed = isLz4Compressed;
             this.statement = statement;
-            if (statement.DirectResults?.ResultSet != null && !statement.DirectResults.ResultSet.HasMoreRows)
-            {
-                return;
-            }
-            operationStatusPoller = new DatabricksOperationStatusPoller(statement);
-            operationStatusPoller.Start();
         }
 
         public override Schema Schema { get { return schema; } }
 
-        protected void StopOperationStatusPoller()
-        {
-            operationStatusPoller?.Stop();
-        }
-
         protected override void Dispose(bool disposing)
         {
-            if (!isDisposed)
-            {
-                if (disposing)
-                {
-                    DisposeOperationStatusPoller();
-                    DisposeResources();
-                }
-                isDisposed = true;
-            }
-
             base.Dispose(disposing);
-        }
-
-        protected virtual void DisposeResources()
-        {
-        }
-
-        protected void DisposeOperationStatusPoller()
-        {
-            if (operationStatusPoller != null)
-            {
-                operationStatusPoller.Stop();
-                operationStatusPoller.Dispose();
-                operationStatusPoller = null;
-            }
+            isDisposed = true;
         }
 
         protected void ThrowIfDisposed()

@@ -155,14 +155,13 @@ public CloudFetchReader(DatabricksStatement statement, Schema schema, TFetchResu
                         }
                     }
 
-                    StopOperationStatusPoller();
                     // If we get here, there are no more files
                     return null;
                 }
             });
         }
 
-        protected override void DisposeResources()
+        protected override void Dispose(bool disposing)
         {
             if (this.currentReader != null)
             {
@@ -181,6 +180,7 @@ protected override void DisposeResources()
                 this.downloadManager.Dispose();
                 this.downloadManager = null;
             }
+            base.Dispose(disposing);
         }
     }
 }
@@ -22,6 +22,7 @@
 using System.Linq;
 using System.Threading;
 using System.Threading.Tasks;
+using Apache.Arrow.Adbc.Drivers.Apache;
 using Apache.Hive.Service.Rpc.Thrift;
 
 namespace Apache.Arrow.Adbc.Drivers.Databricks.CloudFetch
@@ -160,8 +161,11 @@ public async Task StopAsync()
 
                 request.StartRowOffset = offset;
 
+                // Cancelling mid-request breaks the client; Dispose() should not break the underlying client
+                CancellationToken expiringToken = ApacheUtility.GetCancellationToken(_statement.QueryTimeoutSeconds, ApacheUtility.TimeUnit.Seconds);
+
                 // Fetch results
-                TFetchResultsResp response = await _statement.Client.FetchResults(request, cancellationToken);
+                TFetchResultsResp response = await _statement.Client.FetchResults(request, expiringToken);
 
                 // Process the results
                 if (response.Status.StatusCode == TStatusCode.SUCCESS_STATUS &&
@@ -257,7 +261,7 @@ private async Task FetchResultsAsync(CancellationToken cancellationToken)
                 // Add the end of results guard to the queue even in case of error
                 try
                 {
-                    _downloadQueue.Add(EndOfResultsGuard.Instance, CancellationToken.None);
+                    _downloadQueue.TryAdd(EndOfResultsGuard.Instance, 0);
                 }
                 catch (Exception)
                 {
@@ -282,7 +286,9 @@ private async Task FetchNextResultBatchAsync(long? offset, CancellationToken can
             TFetchResultsResp response;
             try
             {
-                response = await _statement.Client.FetchResults(request, cancellationToken).ConfigureAwait(false);
+                // Use the statement's configured query timeout
+                CancellationToken expiringToken = ApacheUtility.GetCancellationToken(_statement.QueryTimeoutSeconds, ApacheUtility.TimeUnit.Seconds);
+                response = await _statement.Client.FetchResults(request, expiringToken).ConfigureAwait(false);
             }
             catch (Exception ex)
             {

@@ -44,5 +44,10 @@ internal interface IHiveServer2Statement
         /// </summary>
         /// <returns>True if direct results are available and contain result data, false otherwise.</returns>
         bool HasDirectResults { get; }
+
+        /// <summary>
+        /// Gets the query timeout in seconds.
+        /// </summary>
+        int QueryTimeoutSeconds { get; }
     }
 }
@@ -16,17 +16,12 @@
  */
 
 using System;
-using System.Collections.Generic;
 using System.Net.Http;
 using System.Threading;
 using System.Threading.Tasks;
-using Apache.Arrow;
-using Apache.Arrow.Adbc;
-using Apache.Arrow.Adbc.Drivers.Apache;
 using Apache.Arrow.Adbc.Drivers.Apache.Hive2;
 using Apache.Arrow.Adbc.Drivers.Databricks.CloudFetch;
 using Apache.Arrow.Adbc.Tracing;
-using Apache.Arrow.Ipc;
 using Apache.Hive.Service.Rpc.Thrift;
 
 namespace Apache.Arrow.Adbc.Drivers.Databricks
@@ -50,6 +45,8 @@ internal sealed class DatabricksCompositeReader : TracingReader
         private readonly TlsProperties _tlsOptions;
         private readonly HiveServer2ProxyConfigurator _proxyConfigurator;
 
+        private DatabricksOperationStatusPoller? operationStatusPoller;
+
         /// <summary>
         /// Initializes a new instance of the <see cref="DatabricksCompositeReader"/> class.
         /// </summary>
@@ -66,10 +63,15 @@ internal DatabricksCompositeReader(DatabricksStatement statement, Schema schema,
             _proxyConfigurator = proxyConfigurator;
 
             // use direct results if available
-            if (_statement.HasDirectResults && _statement.DirectResults != null && _statement.DirectResults.__isset.resultSet)
+            if (_statement.HasDirectResults && _statement.DirectResults != null && _statement.DirectResults.__isset.resultSet && statement.DirectResults?.ResultSet != null)
             {
                 _activeReader = DetermineReader(_statement.DirectResults.ResultSet);
             }
+            if (_statement.DirectResults?.ResultSet.HasMoreRows ?? true)
+            {
+                operationStatusPoller = new DatabricksOperationStatusPoller(statement);
+                operationStatusPoller.Start();
+            }
         }
 
         private BaseDatabricksReader DetermineReader(TFetchResultsResp initialResults)
@@ -93,7 +95,7 @@ private BaseDatabricksReader DetermineReader(TFetchResultsResp initialResults)
         /// </summary>
         /// <param name="cancellationToken">The cancellation token.</param>
         /// <returns>The next record batch, or null if there are no more batches.</returns>
-        public override async ValueTask<RecordBatch?> ReadNextRecordBatchAsync(CancellationToken cancellationToken = default)
+        private async ValueTask<RecordBatch?> ReadNextRecordBatchInternalAsync(CancellationToken cancellationToken = default)
         {
             // Initialize the active reader if not already done
             if (_activeReader == null)
@@ -108,5 +110,34 @@ private BaseDatabricksReader DetermineReader(TFetchResultsResp initialResults)
 
             return await _activeReader.ReadNextRecordBatchAsync(cancellationToken);
         }
+
+        public override async ValueTask<RecordBatch?> ReadNextRecordBatchAsync(CancellationToken cancellationToken = default)
+        {
+            var result = await ReadNextRecordBatchInternalAsync(cancellationToken);
+            // Stop the poller when we've reached the end of results
+            if (result == null)
+            {
+                StopOperationStatusPoller();
+            }
+            return result;
+        }
+
+        protected override void Dispose(bool disposing)
+        {
+            if (disposing)
+            {
+                _activeReader?.Dispose();
+                StopOperationStatusPoller();
+            }
+            _activeReader = null;
+            base.Dispose(disposing);
+        }
+
+        private void StopOperationStatusPoller()
+        {
+            operationStatusPoller?.Stop();
+            operationStatusPoller?.Dispose();
+            operationStatusPoller = null;
+        }
     }
 }
@@ -18,6 +18,7 @@
 using System;
 using System.Threading;
 using System.Threading.Tasks;
+using Apache.Arrow.Adbc.Drivers.Apache;
 using Apache.Arrow.Adbc.Drivers.Databricks.CloudFetch;
 using Apache.Hive.Service.Rpc.Thrift;
 
@@ -31,14 +32,19 @@ internal class DatabricksOperationStatusPoller : IDisposable
     {
         private readonly IHiveServer2Statement _statement;
         private readonly int _heartbeatIntervalSeconds;
+        private readonly int _requestTimeoutSeconds;
         // internal cancellation token source - won't affect the external token
         private CancellationTokenSource? _internalCts;
         private Task? _operationStatusPollingTask;
 
-        public DatabricksOperationStatusPoller(IHiveServer2Statement statement, int heartbeatIntervalSeconds = DatabricksConstants.DefaultOperationStatusPollingIntervalSeconds)
+        public DatabricksOperationStatusPoller(
+            IHiveServer2Statement statement,
+            int heartbeatIntervalSeconds = DatabricksConstants.DefaultOperationStatusPollingIntervalSeconds,
+            int requestTimeoutSeconds = DatabricksConstants.DefaultOperationStatusRequestTimeoutSeconds)
         {
             _statement = statement ?? throw new ArgumentNullException(nameof(statement));
             _heartbeatIntervalSeconds = heartbeatIntervalSeconds;
+            _requestTimeoutSeconds = requestTimeoutSeconds;
         }
 
         public bool IsStarted => _operationStatusPollingTask != null;
@@ -62,29 +68,27 @@ public void Start(CancellationToken externalToken = default)
 
         private async Task PollOperationStatus(CancellationToken cancellationToken)
         {
-            try
+            while (!cancellationToken.IsCancellationRequested)
             {
-                while (!cancellationToken.IsCancellationRequested)
-                {
-                    var operationHandle = _statement.OperationHandle;
-                    if (operationHandle == null) break;
+                var operationHandle = _statement.OperationHandle;
+                if (operationHandle == null) break;
+
+                CancellationToken GetOperationStatusTimeoutToken = ApacheUtility.GetCancellationToken(_requestTimeoutSeconds, ApacheUtility.TimeUnit.Seconds);
 
-                    var request = new TGetOperationStatusReq(operationHandle);
-                    var response = await _statement.Client.GetOperationStatus(request, cancellationToken);
-                    await Task.Delay(TimeSpan.FromSeconds(_heartbeatIntervalSeconds), cancellationToken);
+                var request = new TGetOperationStatusReq(operationHandle);
+                var response = await _statement.Client.GetOperationStatus(request, GetOperationStatusTimeoutToken);
+                await Task.Delay(TimeSpan.FromSeconds(_heartbeatIntervalSeconds), cancellationToken);
 
-                    // end the heartbeat if the command has terminated
-                    if (response.OperationState == TOperationState.CANCELED_STATE ||
-                        response.OperationState == TOperationState.ERROR_STATE)
-                    {
-                        break;
-                    }
+                // end the heartbeat if the command has terminated
+                if (response.OperationState == TOperationState.CANCELED_STATE ||
+                    response.OperationState == TOperationState.ERROR_STATE ||
+                    response.OperationState == TOperationState.CLOSED_STATE ||
+                    response.OperationState == TOperationState.TIMEDOUT_STATE ||
+                    response.OperationState == TOperationState.UKNOWN_STATE)
+                {
+                    break;
                 }
             }
-            catch (TaskCanceledException)
-            {
-                // ignore
-            }
         }
 
         public void Stop()
@@ -94,12 +98,19 @@ public void Stop()
 
         public void Dispose()
         {
-            if (_internalCts != null)
+            _internalCts?.Cancel();
+            try
             {
-                _internalCts.Cancel();
-                _operationStatusPollingTask?.Wait();
-                _internalCts.Dispose();
+                _operationStatusPollingTask?.GetAwaiter().GetResult();
             }
+            catch (OperationCanceledException)
+            {
+                // Expected, no-op
+            }
+
+            _internalCts?.Dispose();
+            _internalCts = null;
+            _operationStatusPollingTask = null;
         }
     }
 }
@@ -226,10 +226,15 @@ public class DatabricksParameters : SparkParameters
     public class DatabricksConstants
     {
         /// <summary>
-        /// Default heartbeat interval in seconds for long-running operations
+        /// Default heartbeat interval in seconds for long-running operations. TODO: make this user-configurable
         /// </summary>
         public const int DefaultOperationStatusPollingIntervalSeconds = 60;
 
+        /// <summary>
+        /// Default timeout in seconds for operation status polling requests. TODO: make this user-configurable
+        /// </summary>
+        public const int DefaultOperationStatusRequestTimeoutSeconds = 30;
+
         /// <summary>
         /// OAuth grant type constants
         /// </summary>

@@ -77,10 +77,9 @@ public DatabricksReader(DatabricksStatement statement, Schema schema, TFetchResu
 
                     if (this.hasNoMoreRows)
                     {
-                        StopOperationStatusPoller();
                         return null;
                     }
-
+                    // TODO: use an expiring cancellationtoken
                     TFetchResultsReq request = new TFetchResultsReq(this.statement.OperationHandle!, TFetchOrientation.FETCH_NEXT, this.statement.BatchSize);
                     TFetchResultsResp response = await this.statement.Connection.Client!.FetchResults(request, cancellationToken);
 

@@ -141,6 +141,9 @@ public TSparkDirectResults? DirectResults
         // Cast the Client to IAsync for CloudFetch compatibility
         TCLIService.IAsync IHiveServer2Statement.Client => Connection.Client;
 
+        // Expose QueryTimeoutSeconds for IHiveServer2Statement
+        int IHiveServer2Statement.QueryTimeoutSeconds => base.QueryTimeoutSeconds;
+
         public override void SetOption(string key, string value)
         {
             switch (key)

@@ -187,10 +187,14 @@ public async Task AllStatementTypesDisposeWithoutErrors(string statementType, st
                 var batch = await queryResult.Stream.ReadNextRecordBatchAsync();
                 // Note: batch might be null for empty results, that's OK
 
+                // test disposing the stream does not throw
+                var streamException = Record.Exception(() => queryResult.Stream.Dispose());
+                Assert.Null(streamException);
+
                 // The critical test: disposal should not throw any exceptions
                 // This specifically tests the fix for the GetColumns bug where _directResults wasn't set
-                var exception = Record.Exception(() => statement.Dispose());
-                Assert.Null(exception);
+                var statementException = Record.Exception(() => statement.Dispose());
+                Assert.Null(statementException);
             }
             catch (Exception ex)
             {