Fix leader election request timeout

The `controller-runtime` uses the `resourcelock.New` function for configuring leader election. This function is known to have an incorrectly configured request timeout, which sets the request timeout equal to the leader election deadline. This allows a single request timeout to trigger a change in leadership.

**Source:**

https://github.com/kubernetes-sigs/controller-runtime/blob/8e44a4307f70a4d5f4c5aaf0869e2bec7167f4ab/pkg/leaderelection/leader_election.go#L101-L109

**Impact:**

This issue causes unnecessary leader changes, which can cause:
* Lower availability - new leader might require reinitialization of informers which can take tens of seconds in large clusters.
* Waste of resources - Increased API server load due to concurrent re-initializations, potentially triggering a KCP scale-up and wasting resources.

**Fix:**

Update controller-runtime to use `resourcelock.NewFromKubeconfig` for leader election. This will ensure that the request timeout is correctly configured and prevent unnecessary leadership changes due to transient network issues or API server unavailability. This change should involve approximately 10 lines of code.

**Example**:

https://github.com/kubernetes/kubernetes/pull/98059


	return resourcelock.New(options.LeaderElectionResourceLock,
	options.LeaderElectionNamespace,
	options.LeaderElectionID,
	corev1Client,
	coordinationClient,
	resourcelock.ResourceLockConfig{
	Identity: id,
	EventRecorder: recorderProvider.GetEventRecorderFor(id),
	})

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Fix leader election request timeout #3027

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

Fix leader election request timeout #3027

Description

Metadata

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

Issue actions