jaegertracing · yurishkuro · May 24, 2018 · Apr 19, 2018 · yurishkuro · May 11, 2018
diff --git a/cmd/agent/app/builder.go b/cmd/agent/app/builder.go
@@ -117,7 +117,13 @@ func (b *Builder) getMetricsFactory() (metrics.Factory, error) {
 	if b.metricsFactory != nil {
 		return b.metricsFactory, nil
 	}
-	return b.Metrics.CreateMetricsFactory("jaeger_agent")
+
+	baseFactory, err := b.Metrics.CreateMetricsFactory("jaeger")
+	if err != nil {
+		return nil, err
+	}
+
+	return baseFactory.Namespace("agent", nil), nil
 }
 
 // CreateAgent creates the Agent

diff --git a/cmd/collector/app/metrics.go b/cmd/collector/app/metrics.go
@@ -60,23 +60,21 @@ type metricsBySvc struct {
 
 // CountsBySpanType measures received, rejected, and receivedByService metrics for a format type
 type CountsBySpanType struct {
-	// Received is the actual number of spans received from upstream
-	Received metrics.Counter
-	// Rejected is the number of spans we rejected (usually due to blacklisting)
-	Rejected metrics.Counter
 	// ReceivedBySvc maintain by-service metrics for a format type
 	ReceivedBySvc metricsBySvc
+	// RejectedBySvc is the number of spans we rejected (usually due to blacklisting) by-service
+	RejectedBySvc metricsBySvc
 }
 
 // NewSpanProcessorMetrics returns a SpanProcessorMetrics
 func NewSpanProcessorMetrics(serviceMetrics metrics.Factory, hostMetrics metrics.Factory, otherFormatTypes []string) *SpanProcessorMetrics {
 	spanCounts := map[string]CountsBySpanType{
-		ZipkinFormatType:  newCountsBySpanType(serviceMetrics.Namespace(ZipkinFormatType, nil)),
-		JaegerFormatType:  newCountsBySpanType(serviceMetrics.Namespace(JaegerFormatType, nil)),
-		UnknownFormatType: newCountsBySpanType(serviceMetrics.Namespace(UnknownFormatType, nil)),
+		ZipkinFormatType:  newCountsBySpanType(serviceMetrics.Namespace("", map[string]string{"format": ZipkinFormatType})),
+		JaegerFormatType:  newCountsBySpanType(serviceMetrics.Namespace("", map[string]string{"format": JaegerFormatType})),
+		UnknownFormatType: newCountsBySpanType(serviceMetrics.Namespace("", map[string]string{"format": UnknownFormatType})),
 	}
 	for _, otherFormatType := range otherFormatTypes {
-		spanCounts[otherFormatType] = newCountsBySpanType(serviceMetrics.Namespace(otherFormatType, nil))
+		spanCounts[otherFormatType] = newCountsBySpanType(serviceMetrics.Namespace("", map[string]string{"format": otherFormatType}))
 	}
 	m := &SpanProcessorMetrics{
 		SaveLatency:    hostMetrics.Timer("save-latency", nil),
@@ -115,9 +113,8 @@ func newMetricsBySvc(factory metrics.Factory, category string) metricsBySvc {
 
 func newCountsBySpanType(factory metrics.Factory) CountsBySpanType {
 	return CountsBySpanType{
-		Received:      factory.Counter("spans.recd", nil),
-		Rejected:      factory.Counter("spans.rejected", nil),
-		ReceivedBySvc: newMetricsBySvc(factory, "by-svc"),
+		RejectedBySvc: newMetricsBySvc(factory, "rejected"),
+		ReceivedBySvc: newMetricsBySvc(factory, "received"),
 	}
 }
 
@@ -179,7 +176,7 @@ func (m *countsBySvc) countByServiceName(serviceName string) {
 	if c, ok := m.counts[serviceName]; ok {
 		counter = c
 	} else if len(m.counts) < maxServiceNames {
-		c := m.factory.Counter(serviceName, nil)
+		c := m.factory.Counter("", map[string]string{"service": serviceName})
 		m.counts[serviceName] = c
 		counter = c
 	}

diff --git a/cmd/collector/app/metrics_test.go b/cmd/collector/app/metrics_test.go
@@ -47,8 +47,8 @@ func TestProcessorMetrics(t *testing.T) {
 	jFormat.ReceivedBySvc.ReportServiceNameForSpan(&mSpan)
 	counters, gauges := baseMetrics.LocalBackend.Snapshot()
 
-	assert.EqualValues(t, 2, counters["service.jaeger.spans.by-svc.fry"])
-	assert.EqualValues(t, 1, counters["service.jaeger.traces.by-svc.fry"])
-	assert.EqualValues(t, 1, counters["service.jaeger.debug-spans.by-svc.fry"])
+	assert.EqualValues(t, 2, counters["service.spans.received|format=jaeger|service=fry"])
+	assert.EqualValues(t, 1, counters["service.traces.received|format=jaeger|service=fry"])
+	assert.EqualValues(t, 1, counters["service.debug-spans.received|format=jaeger|service=fry"])
 	assert.Empty(t, gauges)
 }
diff --git a/cmd/collector/app/span_processor.go b/cmd/collector/app/span_processor.go
@@ -108,7 +108,6 @@ func (sp *spanProcessor) saveSpan(span *model.Span) {
 
 func (sp *spanProcessor) ProcessSpans(mSpans []*model.Span, spanFormat string) ([]bool, error) {
 	sp.preProcessSpans(mSpans)
-	sp.metrics.GetCountsForFormat(spanFormat).Received.Inc(int64(len(mSpans)))
 	sp.metrics.BatchSize.Update(int64(len(mSpans)))
 	retMe := make([]bool, len(mSpans))
 	for i, mSpan := range mSpans {
@@ -131,7 +130,7 @@ func (sp *spanProcessor) enqueueSpan(span *model.Span, originalFormat string) bo
 	spanCounts.ReceivedBySvc.ReportServiceNameForSpan(span)
 
 	if !sp.filterSpan(span) {
-		spanCounts.Rejected.Inc(int64(1))
+		spanCounts.RejectedBySvc.ReportServiceNameForSpan(span)
 		return true // as in "not dropped", because it's actively rejected
 	}
 	item := &queueItem{

diff --git a/cmd/collector/app/span_processor_test.go b/cmd/collector/app/span_processor_test.go
@@ -85,12 +85,13 @@ func TestBySvcMetrics(t *testing.T) {
 		)
 		ctx := context.Background()
 		tctx := thrift.Wrap(ctx)
-		var metricPrefix string
+		var metricPrefix, format string
 		if test.format == ZipkinFormatType {
 			span := makeZipkinSpan(test.serviceName, test.rootSpan, test.debug)
 			zHandler := NewZipkinSpanHandler(logger, processor, zipkinSanitizer.NewParentIDSanitizer())
 			zHandler.SubmitZipkinBatch(tctx, []*zc.Span{span, span})
-			metricPrefix = "service.zipkin"
+			metricPrefix = "service"
+			format = "zipkin"
 		} else if test.format == JaegerFormatType {
 			span, process := makeJaegerSpan(test.serviceName, test.rootSpan, test.debug)
 			jHandler := NewJaegerSpanHandler(logger, processor)
@@ -103,22 +104,22 @@ func TestBySvcMetrics(t *testing.T) {
 					Process: process,
 				},
 			})
-			metricPrefix = "service.jaeger"
+			metricPrefix = "service"
+			format = "jaeger"
 		} else {
 			panic("Unknown format")
 		}
 		expected := []metricsTest.ExpectedMetric{
-			{Name: metricPrefix + ".spans.recd", Value: 2},
-			{Name: metricPrefix + ".spans.by-svc." + test.serviceName, Value: 2},
+			{Name: metricPrefix + ".spans.received|format=" + format + "|service=" + test.serviceName, Value: 2},
 		}
 		if test.debug {
 			expected = append(expected, metricsTest.ExpectedMetric{
-				Name: metricPrefix + ".debug-spans.by-svc." + test.serviceName, Value: 2,
+				Name: metricPrefix + ".debug-spans.received|format=" + format + "|service=" + test.serviceName, Value: 2,
 			})
 		}
 		if test.rootSpan {
 			expected = append(expected, metricsTest.ExpectedMetric{
-				Name: metricPrefix + ".traces.by-svc." + test.serviceName, Value: 2,
+				Name: metricPrefix + ".traces.received|format=" + format + "|service=" + test.serviceName, Value: 2,
 			})
 		}
 		if test.serviceName != blackListedService || test.debug {
@@ -133,7 +134,7 @@ func TestBySvcMetrics(t *testing.T) {
 			})
 		} else {
 			expected = append(expected, metricsTest.ExpectedMetric{
-				Name: metricPrefix + ".spans.rejected", Value: 2,
+				Name: metricPrefix + ".spans.rejected|format=" + format + "|service=" + test.serviceName, Value: 2,
 			})
 		}
 		metricsTest.AssertCounterMetrics(t, mb, expected...)

diff --git a/cmd/collector/main.go b/cmd/collector/main.go
@@ -90,20 +90,21 @@ func main() {
 			builderOpts := new(builder.CollectorOptions).InitFromViper(v)
 
 			mBldr := new(pMetrics.Builder).InitFromViper(v)
-			metricsFactory, err := mBldr.CreateMetricsFactory("jaeger-collector")
+			baseFactory, err := mBldr.CreateMetricsFactory("jaeger")
 			if err != nil {
 				logger.Fatal("Cannot create metrics factory.", zap.Error(err))
 			}
 
 			storageFactory.InitFromViper(v)
-			if err := storageFactory.Initialize(metricsFactory, logger); err != nil {
+			if err := storageFactory.Initialize(baseFactory, logger); err != nil {
 				logger.Fatal("Failed to init storage factory", zap.Error(err))
 			}
 			spanWriter, err := storageFactory.CreateSpanWriter()
 			if err != nil {
 				logger.Fatal("Failed to create span writer", zap.Error(err))
 			}
 
+			metricsFactory := baseFactory.Namespace("collector", nil)
 			handlerBuilder, err := builder.NewSpanHandlerBuilder(
 				builderOpts,
 				spanWriter,

diff --git a/cmd/query/main.go b/cmd/query/main.go
@@ -75,7 +75,7 @@ func main() {
 			queryOpts := new(app.QueryOptions).InitFromViper(v)
 
 			mBldr := new(pMetrics.Builder).InitFromViper(v)
-			metricsFactory, err := mBldr.CreateMetricsFactory("jaeger-query")
+			baseFactory, err := mBldr.CreateMetricsFactory("jaeger")
 			if err != nil {
 				logger.Fatal("Cannot create metrics factory.", zap.Error(err))
 			}
@@ -86,14 +86,14 @@ func main() {
 					Param: 1.0,
 				},
 				RPCMetrics: true,
-			}.New("jaeger-query", jaegerClientConfig.Metrics(metricsFactory))
+			}.New("jaeger-query", jaegerClientConfig.Metrics(baseFactory.Namespace("client", nil)))
 			if err != nil {
 				logger.Fatal("Failed to initialize tracer", zap.Error(err))
 			}
 			defer closer.Close()
 
 			storageFactory.InitFromViper(v)
-			if err := storageFactory.Initialize(metricsFactory, logger); err != nil {
+			if err := storageFactory.Initialize(baseFactory, logger); err != nil {
 				logger.Fatal("Failed to init storage factory", zap.Error(err))
 			}
 			spanReader, err := storageFactory.CreateSpanReader()

diff --git a/cmd/standalone/main.go b/cmd/standalone/main.go
@@ -96,7 +96,7 @@ func main() {
 			}
 
 			mBldr := new(pMetrics.Builder).InitFromViper(v)
-			metricsFactory, err := mBldr.CreateMetricsFactory("jaeger-standalone")
+			metricsFactory, err := mBldr.CreateMetricsFactory("jaeger")
 			if err != nil {
 				return errors.Wrap(err, "Cannot create metrics factory")
 			}
@@ -166,7 +166,7 @@ func startAgent(
 	logger *zap.Logger,
 	baseFactory metrics.Factory,
 ) {
-	metricsFactory := baseFactory.Namespace("jaeger-agent", nil)
+	metricsFactory := baseFactory.Namespace("agent", nil)
 
 	if len(b.CollectorHostPorts) == 0 {
 		b.CollectorHostPorts = append(b.CollectorHostPorts, fmt.Sprintf("127.0.0.1:%d", cOpts.CollectorPort))
@@ -190,7 +190,7 @@ func startCollector(
 	samplingHandler sampling.Handler,
 	hc *healthcheck.HealthCheck,
 ) {
-	metricsFactory := baseFactory.Namespace("jaeger-collector", nil)
+	metricsFactory := baseFactory.Namespace("collector", nil)
 
 	spanBuilder, err := collector.NewSpanHandlerBuilder(
 		cOpts,
@@ -269,7 +269,7 @@ func startQuery(
 			Param: 1.0,
 		},
 		RPCMetrics: true,
-	}.New("jaeger-query", jaegerClientConfig.Metrics(baseFactory))
+	}.New("jaeger-query", jaegerClientConfig.Metrics(baseFactory.Namespace("client", nil)))
 	if err != nil {
 		logger.Fatal("Failed to initialize tracer", zap.Error(err))
 	}

diff --git a/glide.lock b/glide.lock
diff --git a/glide.yaml b/glide.yaml
@@ -17,7 +17,7 @@ import:
   subpackages:
   - transport
 - package: github.com/uber/jaeger-lib
-  version: ^1.4.0
+  version: ^1.5.0
 - package: github.com/uber/tchannel-go
   version: v1.1.0
   subpackages:

diff --git a/pkg/cassandra/metrics/table.go b/pkg/cassandra/metrics/table.go
@@ -33,7 +33,7 @@ type Table struct {
 // NewTable takes a metrics scope and creates a table metrics struct
 func NewTable(factory metrics.Factory, tableName string) *Table {
 	t := storageMetrics.WriteMetrics{}
-	metrics.Init(&t, factory.Namespace(tableName, nil), nil)
+	metrics.Init(&t, factory.Namespace("", map[string]string{"table": tableName}), nil)
 	return &Table{t}
 }
 

diff --git a/pkg/cassandra/metrics/table_test.go b/pkg/cassandra/metrics/table_test.go
@@ -34,31 +34,31 @@ func TestTableEmit(t *testing.T) {
 		{
 			err: nil,
 			counts: map[string]int64{
-				"a_table.attempts": 1,
-				"a_table.inserts":  1,
+				"attempts|table=a_table": 1,
+				"inserts|table=a_table":  1,
 			},
 			gauges: map[string]int64{
-				"a_table.latency-ok.P999": 51,
-				"a_table.latency-ok.P50":  51,
-				"a_table.latency-ok.P75":  51,
-				"a_table.latency-ok.P90":  51,
-				"a_table.latency-ok.P95":  51,
-				"a_table.latency-ok.P99":  51,
+				"latency-ok|table=a_table.P999": 51,
+				"latency-ok|table=a_table.P50":  51,
+				"latency-ok|table=a_table.P75":  51,
+				"latency-ok|table=a_table.P90":  51,
+				"latency-ok|table=a_table.P95":  51,
+				"latency-ok|table=a_table.P99":  51,
 			},
 		},
 		{
 			err: errors.New("some error"),
 			counts: map[string]int64{
-				"a_table.attempts": 1,
-				"a_table.errors":   1,
+				"attempts|table=a_table": 1,
+				"errors|table=a_table":   1,
 			},
 			gauges: map[string]int64{
-				"a_table.latency-err.P999": 51,
-				"a_table.latency-err.P50":  51,
-				"a_table.latency-err.P75":  51,
-				"a_table.latency-err.P90":  51,
-				"a_table.latency-err.P95":  51,
-				"a_table.latency-err.P99":  51,
+				"latency-err|table=a_table.P999": 51,
+				"latency-err|table=a_table.P50":  51,
+				"latency-err|table=a_table.P75":  51,
+				"latency-err|table=a_table.P90":  51,
+				"latency-err|table=a_table.P95":  51,
+				"latency-err|table=a_table.P99":  51,
 			},
 		},
 	}
@@ -82,8 +82,8 @@ func TestTableExec(t *testing.T) {
 		{
 			q: insertQuery{},
 			counts: map[string]int64{
-				"a_table.attempts": 1,
-				"a_table.inserts":  1,
+				"attempts|table=a_table": 1,
+				"inserts|table=a_table":  1,
 			},
 		},
 		{
@@ -92,8 +92,8 @@ func TestTableExec(t *testing.T) {
 				err: errors.New("failed"),
 			},
 			counts: map[string]int64{
-				"a_table.attempts": 1,
-				"a_table.errors":   1,
+				"attempts|table=a_table": 1,
+				"errors|table=a_table":   1,
 			},
 		},
 		{
@@ -103,8 +103,8 @@ func TestTableExec(t *testing.T) {
 			},
 			log: true,
 			counts: map[string]int64{
-				"a_table.attempts": 1,
-				"a_table.errors":   1,
+				"attempts|table=a_table": 1,
+				"errors|table=a_table":   1,
 			},
 		},
 	}

diff --git a/pkg/es/config/config.go b/pkg/es/config/config.go
@@ -62,7 +62,7 @@ func (c *Configuration) NewClient(logger *zap.Logger, metricsFactory metrics.Fac
 		return nil, err
 	}
 
-	sm := storageMetrics.NewWriteMetrics(metricsFactory, "BulkIndex")
+	sm := storageMetrics.NewWriteMetrics(metricsFactory, "bulk_index")
 	m := sync.Map{}
 
 	service, err := rawClient.BulkProcessor().

diff --git a/pkg/metrics/builder_test.go b/pkg/metrics/builder_test.go
@@ -51,7 +51,7 @@ func TestBuilder(t *testing.T) {
 		families, err := prometheus.DefaultGatherer.Gather()
 		require.NoError(t, err)
 		for _, mf := range families {
-			if mf.GetName() == "foo:counter" {
+			if mf.GetName() == "foo_counter" {
 				return
 			}
 		}

diff --git a/plugin/storage/cassandra/dependencystore/storage.go b/plugin/storage/cassandra/dependencystore/storage.go
@@ -49,7 +49,7 @@ func NewDependencyStore(
 	return &DependencyStore{
 		session:                  session,
 		dependencyDataFrequency:  dependencyDataFrequency,
-		dependenciesTableMetrics: casMetrics.NewTable(metricsFactory, "Dependencies"),
+		dependenciesTableMetrics: casMetrics.NewTable(metricsFactory, "dependencies"),
 		logger: logger,
 	}
 }

diff --git a/plugin/storage/cassandra/samplingstore/storage.go b/plugin/storage/cassandra/samplingstore/storage.go
@@ -62,8 +62,8 @@ func New(session cassandra.Session, factory metrics.Factory, logger *zap.Logger)
 	return &SamplingStore{
 		session: session,
 		metrics: samplingStoreMetrics{
-			operationThroughput: casMetrics.NewTable(factory, "OperationThroughput"),
-			probabilities:       casMetrics.NewTable(factory, "Probabilities"),
+			operationThroughput: casMetrics.NewTable(factory, "operation_throughput"),
+			probabilities:       casMetrics.NewTable(factory, "probabilities"),
 		},
 		logger: logger,
 	}

diff --git a/plugin/storage/cassandra/spanstore/operation_names.go b/plugin/storage/cassandra/spanstore/operation_names.go
@@ -54,7 +54,7 @@ func NewOperationNamesStorage(
 		session:       session,
 		InsertStmt:    insertOperationName,
 		QueryStmt:     queryOperationNames,
-		metrics:       casMetrics.NewTable(metricsFactory, "OperationNames"),
+		metrics:       casMetrics.NewTable(metricsFactory, "operation_names"),
 		writeCacheTTL: writeCacheTTL,
 		logger:        logger,
 		operationNames: cache.NewLRUWithOptions(