cortexproject · juliusv · Jan 31, 2017 · Jan 30, 2017 · Jan 30, 2017 · juliusv
diff --git a/distributor/distributor.go b/distributor/distributor.go
@@ -1,6 +1,7 @@
 package distributor
 
 import (
+	"errors"
 	"flag"
 	"fmt"
 	"hash/fnv"
@@ -12,6 +13,7 @@ import (
 	"github.com/mwitkow/go-grpc-middleware"
 	"github.com/opentracing/opentracing-go"
 	"golang.org/x/net/context"
+	"golang.org/x/time/rate"
 	"google.golang.org/grpc"
 
 	"github.com/prometheus/client_golang/prometheus"
@@ -28,6 +30,8 @@ import (
 	"github.com/weaveworks/cortex/util"
 )
 
+var errIngestionRateLimitExceeded = errors.New("ingestion rate limit exceeded")
+
 var (
 	numClientsDesc = prometheus.NewDesc(
 		"cortex_distributor_ingester_clients",
@@ -46,6 +50,10 @@ type Distributor struct {
 	quit       chan struct{}
 	done       chan struct{}
 
+	// Per-user rate limiters.
+	ingestLimitersMtx sync.Mutex
+	ingestLimiters    map[string]*rate.Limiter
+
 	queryDuration          *prometheus.HistogramVec
 	receivedSamples        prometheus.Counter
 	sendDuration           *prometheus.HistogramVec
@@ -77,6 +85,8 @@ type Config struct {
 	HeartbeatTimeout    time.Duration
 	RemoteTimeout       time.Duration
 	ClientCleanupPeriod time.Duration
+	IngestionRateLimit  float64
+	IngestionBurstSize  int
 }
 
 // RegisterFlags adds the flags required to config this to the given FlagSet
@@ -86,6 +96,8 @@ func (cfg *Config) RegisterFlags(f *flag.FlagSet) {
 	flag.DurationVar(&cfg.HeartbeatTimeout, "distributor.heartbeat-timeout", time.Minute, "The heartbeat timeout after which ingesters are skipped for reads/writes.")
 	flag.DurationVar(&cfg.RemoteTimeout, "distributor.remote-timeout", 2*time.Second, "Timeout for downstream ingesters.")
 	flag.DurationVar(&cfg.ClientCleanupPeriod, "distributor.client-cleanup-period", 15*time.Second, "How frequently to clean up clients for ingesters that have gone away.")
+	flag.Float64Var(&cfg.IngestionRateLimit, "distributor.ingestion-rate-limit", 25000, "Per-user ingestion rate limit in samples per second.")
+	flag.IntVar(&cfg.IngestionBurstSize, "distributor.ingestion-burst-size", 50000, "Per-user allowed ingestion burst size (in number of samples).")
 }
 
 // New constructs a new Distributor
@@ -97,11 +109,12 @@ func New(cfg Config, ring ReadRing) (*Distributor, error) {
 		return nil, fmt.Errorf("MinReadSuccesses > ReplicationFactor: %d > %d", cfg.MinReadSuccesses, cfg.ReplicationFactor)
 	}
 	d := &Distributor{
-		cfg:     cfg,
-		ring:    ring,
-		clients: map[string]ingesterClient{},
-		quit:    make(chan struct{}),
-		done:    make(chan struct{}),
+		cfg:            cfg,
+		ring:           ring,
+		clients:        map[string]ingesterClient{},
+		quit:           make(chan struct{}),
+		done:           make(chan struct{}),
+		ingestLimiters: map[string]*rate.Limiter{},
 		queryDuration: prometheus.NewHistogramVec(prometheus.HistogramOpts{
 			Namespace: "cortex",
 			Name:      "distributor_query_duration_seconds",
@@ -255,6 +268,11 @@ func (d *Distributor) Push(ctx context.Context, req *remote.WriteRequest) (*cort
 	samples := util.FromWriteRequest(req)
 	d.receivedSamples.Add(float64(len(samples)))
 
+	limiter := d.getOrCreateIngestLimiter(userID)
+	if !limiter.AllowN(time.Now(), len(samples)) {
+		return nil, errIngestionRateLimitExceeded
+	}
+
 	keys := make([]uint32, len(samples), len(samples))
 	for i, sample := range samples {
 		keys[i] = tokenForMetric(userID, sample.Metric)
@@ -286,7 +304,7 @@ func (d *Distributor) Push(ctx context.Context, req *remote.WriteRequest) (*cort
 		}
 
 		// This is just a shortcut - if there are not minSuccess available ingesters,
-		// after filtering out dead ones, don't even both trying.
+		// after filtering out dead ones, don't even bother trying.
 		if len(liveIngesters) < sampleTrackers[i].minSuccess {
 			return nil, fmt.Errorf("wanted at least %d live ingesters to process write, had %d",
 				sampleTrackers[i].minSuccess, len(liveIngesters))
@@ -320,6 +338,19 @@ func (d *Distributor) Push(ctx context.Context, req *remote.WriteRequest) (*cort
 	return &cortex.WriteResponse{}, nil
 }
 
+func (d *Distributor) getOrCreateIngestLimiter(userID string) *rate.Limiter {
+	d.ingestLimitersMtx.Lock()
+	defer d.ingestLimitersMtx.Unlock()
+
+	if limiter, ok := d.ingestLimiters[userID]; ok {
+		return limiter
+	}
+
+	limiter := rate.NewLimiter(rate.Limit(d.cfg.IngestionRateLimit), d.cfg.IngestionBurstSize)
+	d.ingestLimiters[userID] = limiter
+	return limiter
+}
+
 func (d *Distributor) sendSamples(ctx context.Context, ingester *ring.IngesterDesc, sampleTrackers []*sampleTracker) error {
 	client, err := d.getClientFor(ingester)
 	if err != nil {

diff --git a/distributor/http_server.go b/distributor/http_server.go
@@ -21,8 +21,13 @@ func (d *Distributor) PushHandler(w http.ResponseWriter, r *http.Request) {
 
 	_, err := d.Push(ctx, &req)
 	if err != nil {
+		switch err {
+		case errIngestionRateLimitExceeded:
+			http.Error(w, err.Error(), http.StatusTooManyRequests)
+		default:
+			http.Error(w, err.Error(), http.StatusInternalServerError)
+		}
 		log.Errorf("append err: %v", err)
-		http.Error(w, err.Error(), http.StatusInternalServerError)
 	}
 }
 

diff --git a/vendor/golang.org/x/time/rate/LICENSE b/vendor/golang.org/x/time/rate/LICENSE