envoyproxy · mattklein123 · Sep 9, 2019 · Aug 9, 2019 · Aug 9, 2019 · Aug 9, 2019
diff --git a/api/envoy/config/filter/http/adaptive_concurrency/v2alpha/BUILD b/api/envoy/config/filter/http/adaptive_concurrency/v2alpha/BUILD
@@ -7,5 +7,6 @@ api_proto_library_internal(
  srcs = ["adaptive_concurrency.proto"],
  deps = [
  "//envoy/api/v2/core:base",
+ "//envoy/type:percent",
  ],
 )
diff --git a/api/envoy/config/filter/http/adaptive_concurrency/v2alpha/adaptive_concurrency.proto b/api/envoy/config/filter/http/adaptive_concurrency/v2alpha/adaptive_concurrency.proto
@@ -7,5 +7,55 @@ option java_outer_classname = "AdaptiveConcurrencyProto";
 option java_multiple_files = true;
 option go_package = "v2alpha";
 
+import "envoy/type/percent.proto";
+
+import "google/protobuf/duration.proto";
+import "google/api/annotations.proto";
+import "google/protobuf/wrappers.proto";
+
+import "validate/validate.proto";
+
+// Configuration parameters for the gradient controller.
+message GradientControllerConfig {
+ // The percentile to use when summarizing aggregated samples. Defaults to p50.
+ envoy.type.Percent sample_aggregate_percentile = 1;
+
+ // Parameters controlling the periodic recalculation of the concurrency limit from sampled request
+ // latencies.
+ message ConcurrencyLimitCalculationParams {
+ // The maximum value the gradient is allowed to take. This influences how aggressively the
+ // concurrency limit can increase. Defaults to 2.0.
+ google.protobuf.DoubleValue max_gradient = 1 [(validate.rules).double.gt = 1.0];
+
+ // The allowed upper-bound on the calculated concurrency limit. Defaults to 1000.
+ google.protobuf.UInt32Value max_concurrency_limit = 2;
+
+ // The period of time samples are taken to recalculate the concurrency limit.
+ google.protobuf.Duration concurrency_update_interval = 3
+ [(validate.rules).duration.gt = {}, (validate.rules).duration.required = true];
+ }
+ ConcurrencyLimitCalculationParams concurrency_limit_params = 2
+ [(validate.rules).message.required = true];
+
+ // Parameters controlling the periodic minRTT recalculation.
+ message MinimumRTTCalculationParams {
+ // The time interval between recalculating the minimum request round-trip time.
+ google.protobuf.Duration interval = 1
+ [(validate.rules).duration.gt = {}, (validate.rules).duration.required = true];
+
+ // The number of requests to aggregate/sample during the minRTT recalculation window before
+ // updating. Defaults to 50.
+ google.protobuf.UInt32Value request_count = 2;
+ };
+ MinimumRTTCalculationParams min_rtt_calc_params = 3 [(validate.rules).message.required = true];
+}
+
 message AdaptiveConcurrency {
+ oneof concurrency_controller_config {
+ option (validate.required) = true;
+
+ // Gradient concurrency control will be used.
+ GradientControllerConfig gradient_controller_config = 1
+ [(validate.rules).message.required = true];
+ }
 }
diff --git a/source/extensions/filters/http/adaptive_concurrency/adaptive_concurrency_filter.cc b/source/extensions/filters/http/adaptive_concurrency/adaptive_concurrency_filter.cc
@@ -37,8 +37,8 @@ Http::FilterHeadersStatus AdaptiveConcurrencyFilter::decodeHeaders(Http::HeaderM
 }
 
 void AdaptiveConcurrencyFilter::encodeComplete() {
- const auto rq_latency = config_->timeSource().monotonicTime() - rq_start_time_;
- controller_->recordLatencySample(rq_latency);
+ auto rq_latency = config_->timeSource().monotonicTime() - rq_start_time_;
+ controller_->recordLatencySample(std::move(rq_latency));
 }
 
 } // namespace AdaptiveConcurrency

diff --git a/source/extensions/filters/http/adaptive_concurrency/concurrency_controller/BUILD b/source/extensions/filters/http/adaptive_concurrency/concurrency_controller/BUILD
@@ -14,10 +14,20 @@ envoy_package()
 
 envoy_cc_library(
  name = "concurrency_controller_lib",
- srcs = [],
+ srcs = ["gradient_controller.cc"],
  hdrs = [
  "concurrency_controller.h",
+ "gradient_controller.h",
+ ],
+ external_deps = [
+ "libcircllhist",
  ],
  deps = [
+ "//source/common/event:dispatcher_lib",
+ "//source/common/protobuf",
+ "//source/common/runtime:runtime_lib",
+ "//source/common/stats:isolated_store_lib",
+ "//source/common/stats:stats_lib",
+ "@envoy_api//envoy/config/filter/http/adaptive_concurrency/v2alpha:adaptive_concurrency_cc",
  ],
 )
diff --git a/...ensions/filters/http/adaptive_concurrency/concurrency_controller/concurrency_controller.h b/...ensions/filters/http/adaptive_concurrency/concurrency_controller/concurrency_controller.h
@@ -43,7 +43,12 @@ class ConcurrencyController {
  *
  * @param rq_latency is the clocked round-trip time for the request.
  */
- virtual void recordLatencySample(const std::chrono::nanoseconds& rq_latency) PURE;
+ virtual void recordLatencySample(std::chrono::nanoseconds rq_latency) PURE;
+
+ /**
+ * Returns the current concurrency limit.
+ */
+ virtual uint32_t concurrencyLimit() const PURE;
 };
 
 } // namespace ConcurrencyController

diff --git a/...xtensions/filters/http/adaptive_concurrency/concurrency_controller/gradient_controller.cc b/...xtensions/filters/http/adaptive_concurrency/concurrency_controller/gradient_controller.cc
@@ -0,0 +1,180 @@
+#include "extensions/filters/http/adaptive_concurrency/concurrency_controller/gradient_controller.h"
+
+#include <atomic>
+#include <chrono>
+
+#include "envoy/config/filter/http/adaptive_concurrency/v2alpha/adaptive_concurrency.pb.h"
+#include "envoy/event/dispatcher.h"
+#include "envoy/runtime/runtime.h"
+#include "envoy/stats/stats.h"
+
+#include "common/common/cleanup.h"
+#include "common/protobuf/protobuf.h"
+#include "common/protobuf/utility.h"
+
+#include "extensions/filters/http/adaptive_concurrency/concurrency_controller/concurrency_controller.h"
+
+#include "absl/synchronization/mutex.h"
+
+namespace Envoy {
+namespace Extensions {
+namespace HttpFilters {
+namespace AdaptiveConcurrency {
+namespace ConcurrencyController {
+
+GradientControllerConfig::GradientControllerConfig(
+ const envoy::config::filter::http::adaptive_concurrency::v2alpha::GradientControllerConfig&
+ proto_config)
+ : min_rtt_calc_interval_(std::chrono::milliseconds(
+ DurationUtil::durationToMilliseconds(proto_config.min_rtt_calc_params().interval()))),
+ sample_rtt_calc_interval_(std::chrono::milliseconds(DurationUtil::durationToMilliseconds(
+ proto_config.concurrency_limit_params().concurrency_update_interval()))),
+ max_concurrency_limit_(PROTOBUF_GET_WRAPPED_OR_DEFAULT(
+ proto_config.concurrency_limit_params(), max_concurrency_limit, 1000)),
+ min_rtt_aggregate_request_count_(
+ PROTOBUF_GET_WRAPPED_OR_DEFAULT(proto_config.min_rtt_calc_params(), request_count, 50)),
+ max_gradient_(PROTOBUF_GET_WRAPPED_OR_DEFAULT(proto_config.concurrency_limit_params(),
+ max_gradient, 2.0)),
+ sample_aggregate_percentile_(PROTOBUF_PERCENT_TO_ROUNDED_INTEGER_OR_DEFAULT(
+ proto_config, sample_aggregate_percentile, 1000, 500) /
+ 1000.0) {}
+
+GradientController::GradientController(GradientControllerConfigSharedPtr config,
+ Event::Dispatcher& dispatcher, Runtime::Loader&,
+ const std::string& stats_prefix, Stats::Scope& scope)
+ : config_(std::move(config)), dispatcher_(dispatcher), scope_(scope),
+ stats_(generateStats(scope_, stats_prefix)), recalculating_min_rtt_(true),
+ num_rq_outstanding_(0), concurrency_limit_(1),
+ latency_sample_hist_(hist_fast_alloc(), hist_free) {
+ min_rtt_calc_timer_ = dispatcher_.createTimer([this]() -> void {
+ absl::MutexLock ml(&update_window_mtx_);
+ setMinRTTSamplingWindow();
+ });
+
+ sample_reset_timer_ = dispatcher_.createTimer([this]() -> void {
+ {
+ absl::MutexLock ml(&update_window_mtx_);
+ resetSampleWindow();
+ }
+ sample_reset_timer_->enableTimer(config_->sample_rtt_calc_interval());
+ });
+
+ sample_reset_timer_->enableTimer(config_->sample_rtt_calc_interval());
+ stats_.concurrency_limit_.set(concurrency_limit_.load());
+}
+
+GradientControllerStats GradientController::generateStats(Stats::Scope& scope,
+ const std::string& stats_prefix) {
+ return {ALL_GRADIENT_CONTROLLER_STATS(POOL_GAUGE_PREFIX(scope, stats_prefix))};
+}
+
+void GradientController::setMinRTTSamplingWindow() {
+ // Set the minRTT flag to indicate we're gathering samples to update the value. This will
+ // prevent the sample window from resetting until enough requests are gathered to complete the
+ // recalculation.
+ concurrency_limit_.store(1);
+ stats_.concurrency_limit_.set(concurrency_limit_.load());
+ recalculating_min_rtt_.store(true);
+
+ // Throw away any latency samples from before the recalculation window as it may not represent
+ // the minRTT.
+ absl::MutexLock ml(&latency_sample_mtx_);
+ hist_clear(latency_sample_hist_.get());
+}
+
+void GradientController::updateMinRTT() {
+ ASSERT(recalculating_min_rtt_.load());
+
+ // Reset the timer to ensure the next minRTT sampling window upon leaving scope.
+ auto defer =
+ Cleanup([this]() { min_rtt_calc_timer_->enableTimer(config_->min_rtt_calc_interval()); });
+
+ absl::MutexLock ml(&latency_sample_mtx_);
+ min_rtt_ = processLatencySamplesAndClear();
+ stats_.min_rtt_msecs_.set(
+ std::chrono::duration_cast<std::chrono::milliseconds>(min_rtt_).count());
+ recalculating_min_rtt_.store(false);
+}
+
+void GradientController::resetSampleWindow() {
+ // The sampling window must not be reset while sampling for the new minRTT value.
+ if (recalculating_min_rtt_.load()) {
+ return;
+ }
+
+ absl::MutexLock ml(&latency_sample_mtx_);
+ if (hist_sample_count(latency_sample_hist_.get()) == 0) {
+ return;
+ }
+
+ sample_rtt_ = processLatencySamplesAndClear();
+ concurrency_limit_.store(calculateNewLimit());
+ stats_.concurrency_limit_.set(concurrency_limit_.load());
+}
+
+std::chrono::microseconds GradientController::processLatencySamplesAndClear() {
+ const std::array<double, 1> quantile{config_->sample_aggregate_percentile()};
+ std::array<double, 1> calculated_quantile;
+ hist_approx_quantile(latency_sample_hist_.get(), quantile.data(), 1, calculated_quantile.data());
+ hist_clear(latency_sample_hist_.get());
+ return std::chrono::microseconds(static_cast<int>(calculated_quantile[0]));
+}
+
+uint32_t GradientController::calculateNewLimit() {
+ // Calculate the gradient value, ensuring it remains below the configured maximum.
+ ASSERT(sample_rtt_.count() > 0);
+ const double raw_gradient = static_cast<double>(min_rtt_.count()) / sample_rtt_.count();
+ const double gradient = std::min(config_->max_gradient(), raw_gradient);
+ stats_.gradient_.set(gradient);
+
+ const double limit = concurrency_limit_.load() * gradient;
+ const double burst_headroom = sqrt(limit);
+ stats_.burst_queue_size_.set(burst_headroom);
+
+ // The final concurrency value factors in the burst headroom and must be clamped to keep the value
+ // in the range [1, configured_max].
+ const auto clamp = [](int min, int max, int val) { return std::max(min, std::min(max, val)); };
+ const uint32_t new_limit = limit + burst_headroom;
+ return clamp(1, config_->max_concurrency_limit(), new_limit);
+}
+
+RequestForwardingAction GradientController::forwardingDecision() {
+ // Note that a race condition exists here which would allow more outstanding requests than the
+ // concurrency limit bounded by the number of worker threads. After loading num_rq_outstanding_
+ // and before loading concurrency_limit_, another thread could potentially swoop in and modify
+ // num_rq_outstanding_, causing us to move forward with stale values and increment
+ // num_rq_outstanding_.
+ //
+ // TODO (tonya11en): Reconsider using a CAS loop here.
+ if (num_rq_outstanding_.load() < concurrency_limit_.load()) {
+ ++num_rq_outstanding_;
+ return RequestForwardingAction::Forward;
+ }
+ return RequestForwardingAction::Block;
+}
+
+void GradientController::recordLatencySample(std::chrono::nanoseconds rq_latency) {
+ const uint32_t latency_usec =
+ std::chrono::duration_cast<std::chrono::microseconds>(rq_latency).count();
+ ASSERT(num_rq_outstanding_.load() > 0);
+ --num_rq_outstanding_;
+
+ uint32_t sample_count;
+ {
+ absl::MutexLock ml(&latency_sample_mtx_);
+ hist_insert(latency_sample_hist_.get(), latency_usec, 1);
+ sample_count = hist_sample_count(latency_sample_hist_.get());
+ }
+
+ if (recalculating_min_rtt_.load() && sample_count >= config_->min_rtt_aggregate_request_count()) {
+ // This sample has pushed the request count over the request count requirement for the minRTT
+ // recalculation. It must now be finished.
+ updateMinRTT();
+ }
+}
+
+} // namespace ConcurrencyController
+} // namespace AdaptiveConcurrency
+} // namespace HttpFilters
+} // namespace Extensions
+} // namespace Envoy