elastic · fearful-symmetry · Mar 7, 2022 · Jan 5, 2022 · Feb 3, 2022 · Feb 8, 2022
@@ -21,9 +21,12 @@
 package diskio
 
 import (
+	"math"
+
 	"github.com/pkg/errors"
 	"github.com/shirou/gopsutil/v3/disk"
 
+	"github.com/elastic/beats/v7/libbeat/common"
 	"github.com/elastic/beats/v7/libbeat/metric/system/numcpu"
 )
 
@@ -52,6 +55,28 @@ func (stat *IOStat) OpenSampling() error {
 	return stat.curCPU.Get()
 }
 
+// a few of the diskio counters are actually 32-bit on the kernel side, which means they can roll over fairly easily.
+// Here we try to reconstruct the values by calculating the pre-rollover delta from unt32 max, then adding.
+// If you want to get technical, this could be a tad unsafe, as we don't actually have any way of knowing if the word size changes in a future kernel, and we've rolled over at UINT64_MAX
+
+// See https://docs.kernel.org/admin-guide/iostats.html and https://github.com/torvalds/linux/blob/master/block/genhd.c diskstats_show()
+func returnOrFixRollover(current, prev uint64) uint64 {
+	var maxUint32 uint64 = math.MaxUint32 //4_294_967_295 Max value in uint32/unsigned int
+
+	if current >= prev {
+		return current - prev
+	}
+	// we're at a uint64 if we hit this
+	if prev > maxUint32 {
+		return 0
+	}
+
+	delta := maxUint32 - prev
+
+	return delta + current
+
+}
+
 // CalcIOStatistics calculates IO statistics.
 func (stat *IOStat) CalcIOStatistics(counter disk.IOCountersStat) (IOMetric, error) {
 	var last disk.IOCountersStat
@@ -72,13 +97,14 @@ func (stat *IOStat) CalcIOStatistics(counter disk.IOCountersStat) (IOMetric, err
 	rdIOs := counter.ReadCount - last.ReadCount
 	rdMerges := counter.MergedReadCount - last.MergedReadCount
 	rdBytes := counter.ReadBytes - last.ReadBytes
-	rdTicks := counter.ReadTime - last.ReadTime
+	rdTicks := returnOrFixRollover(counter.ReadTime, last.ReadTime)
 	wrIOs := counter.WriteCount - last.WriteCount
 	wrMerges := counter.MergedWriteCount - last.MergedWriteCount
 	wrBytes := counter.WriteBytes - last.WriteBytes
-	wrTicks := counter.WriteTime - last.WriteTime
-	ticks := counter.IoTime - last.IoTime
-	aveq := counter.WeightedIO - last.WeightedIO
+	wrTicks := returnOrFixRollover(counter.WriteTime, last.WriteTime)
+	ticks := returnOrFixRollover(counter.IoTime, last.IoTime)
+	aveq := returnOrFixRollover(counter.WeightedIO, last.WeightedIO)
+
 	nIOs := rdIOs + wrIOs
 	nTicks := rdTicks + wrTicks
 	nBytes := rdBytes + wrBytes
@@ -94,7 +120,7 @@ func (stat *IOStat) CalcIOStatistics(counter disk.IOCountersStat) (IOMetric, err
 
 	queue := float64(aveq) / deltams
 	perSec := func(x uint64) float64 {
-		return 1000.0 * float64(x) / deltams
+		return common.Round(1000.0*float64(x)/deltams, common.DefaultDecimalPlacesCount)
 	}
 
 	result := IOMetric{}
@@ -104,17 +130,17 @@ func (stat *IOStat) CalcIOStatistics(counter disk.IOCountersStat) (IOMetric, err
 	result.WriteRequestCountPerSec = perSec(wrIOs)
 	result.ReadBytesPerSec = perSec(rdBytes)
 	result.WriteBytesPerSec = perSec(wrBytes)
-	result.AvgRequestSize = size
-	result.AvgQueueSize = queue
-	result.AvgAwaitTime = wait
+	result.AvgRequestSize = common.Round(size, common.DefaultDecimalPlacesCount)
+	result.AvgQueueSize = common.Round(queue, common.DefaultDecimalPlacesCount)
+	result.AvgAwaitTime = common.Round(wait, common.DefaultDecimalPlacesCount)
 	if rdIOs > 0 {
-		result.AvgReadAwaitTime = float64(rdTicks) / float64(rdIOs)
+		result.AvgReadAwaitTime = common.Round(float64(rdTicks)/float64(rdIOs), common.DefaultDecimalPlacesCount)
 	}
 	if wrIOs > 0 {
-		result.AvgWriteAwaitTime = float64(wrTicks) / float64(wrIOs)
+		result.AvgWriteAwaitTime = common.Round(float64(wrTicks)/float64(wrIOs), common.DefaultDecimalPlacesCount)
 	}
-	result.AvgServiceTime = svct
-	result.BusyPct = 100.0 * float64(ticks) / deltams
+	result.AvgServiceTime = common.Round(svct, common.DefaultDecimalPlacesCount)
+	result.BusyPct = common.Round(100.0*float64(ticks)/deltams, common.DefaultDecimalPlacesCount)
 	if result.BusyPct > 100.0 {
 		result.BusyPct = 100.0
 	}

@@ -21,11 +21,13 @@
 package diskio
 
 import (
+	"math"
 	"testing"
 
 	"github.com/shirou/gopsutil/v3/disk"
 	"github.com/stretchr/testify/assert"
 
+	"github.com/elastic/beats/v7/libbeat/common"
 	sigar "github.com/elastic/gosigar"
 )
 
@@ -34,6 +36,23 @@ func Test_GetCLKTCK(t *testing.T) {
 	assert.Equal(t, uint32(100), GetCLKTCK())
 }
 
+func Test32BitRollover(t *testing.T) {
+	var maxUint32 uint64 = math.MaxUint32 // 4_294_967_295
+
+	var prev = maxUint32 - 100_000
+
+	// A rolled-over value
+	var current32 uint64 = 1000
+	// Theoretical un-rolled over value
+	var current64 = (maxUint32 + current32)
+
+	var correct = current64 - prev
+	assert.Equal(t, returnOrFixRollover(current32, prev), returnOrFixRollover(current64, prev))
+	assert.Equal(t, correct, returnOrFixRollover(current32, prev))
+
+	assert.Equal(t, uint64(0), returnOrFixRollover(current32, current32))
+}
+
 func TestDiskIOStat_CalIOStatistics(t *testing.T) {
 	counter := disk.IOCountersStat{
 		ReadCount:  13,
@@ -58,7 +77,7 @@ func TestDiskIOStat_CalIOStatistics(t *testing.T) {
 	}
 
 	expected := IOMetric{
-		AvgAwaitTime:      24.0 / 22.0,
+		AvgAwaitTime:      common.Round(24.0/22.0, common.DefaultDecimalPlacesCount),
 		AvgReadAwaitTime:  1.2,
 		AvgWriteAwaitTime: 1,
 	}

@@ -8,10 +8,10 @@
     "linux": {
         "iostat": {
             "await": 0,
-            "busy": 0,
-            "name": "sr0",
+            "busy": 0.1503,
+            "name": "sda",
             "queue": {
-                "avg_size": 0
+                "avg_size": 0.0005
             },
             "read": {
                 "await": 0,
@@ -24,17 +24,17 @@
                 }
             },
             "request": {
-                "avg_size": 0
+                "avg_size": 2867.2
             },
-            "service_time": 0,
+            "service_time": 0.3,
             "write": {
                 "await": 0,
                 "per_sec": {
-                    "bytes": 0
+                    "bytes": 14365.929
                 },
                 "request": {
                     "merges_per_sec": 0,
-                    "per_sec": 0
+                    "per_sec": 5.0104
                 }
             }
         }