[k8s.io] Rescheduler [Serial] should ensure that critical pod is scheduled in case there is no resources available {Kubernetes e2e suite} #32531

k8s-github-robot · 2016-09-12T23:12:16Z

https://k8s-gubernator.appspot.com/build/kubernetes-jenkins/logs/kubernetes-e2e-gke-serial/2248/

Failed: [k8s.io] Rescheduler [Serial] should ensure that critical pod is scheduled in case there is no resources available {Kubernetes e2e suite}

/go/src/k8s.io/kubernetes/_output/dockerized/go/src/k8s.io/kubernetes/test/e2e/rescheduler.go:67
Expected error:
    <*errors.errorString | 0xc8211e20b0>: {
        s: "Error while waiting for replication controller kube-dns-v19 pods to be running: Timeout while waiting for pods with labels \"k8s-app=kube-dns,version=v19\" to be running",
    }
    Error while waiting for replication controller kube-dns-v19 pods to be running: Timeout while waiting for pods with labels "k8s-app=kube-dns,version=v19" to be running
not to have occurred
/go/src/k8s.io/kubernetes/_output/dockerized/go/src/k8s.io/kubernetes/test/e2e/rescheduler.go:66

Previous issues for this test: #31277 #31347 #31710 #32260

The text was updated successfully, but these errors were encountered:

k8s-github-robot · 2016-09-19T23:18:00Z

[FLAKE-PING] @mtaufen

This flaky-test issue would love to have more attention.

k8s-github-robot · 2016-11-26T21:58:54Z

https://k8s-gubernator.appspot.com/build/kubernetes-jenkins/logs/ci-kubernetes-e2e-gke-staging/31/

Failed: [k8s.io] Rescheduler [Serial] should ensure that critical pod is scheduled in case there is no resources available {Kubernetes e2e suite}

/go/src/k8s.io/kubernetes/_output/dockerized/go/src/k8s.io/kubernetes/test/e2e/rescheduler.go:67
Expected error:
    <*errors.errorString | 0xc821c980e0>: {
        s: "Error while waiting for replication controller kube-dns-v20 pods to be running: Timeout while waiting for pods with labels \"k8s-app=kube-dns,version=v20\" to be running",
    }
    Error while waiting for replication controller kube-dns-v20 pods to be running: Timeout while waiting for pods with labels "k8s-app=kube-dns,version=v20" to be running
not to have occurred
/go/src/k8s.io/kubernetes/_output/dockerized/go/src/k8s.io/kubernetes/test/e2e/rescheduler.go:66

k8s-github-robot · 2016-11-28T10:09:49Z

https://k8s-gubernator.appspot.com/build/kubernetes-jenkins/logs/ci-kubernetes-e2e-gci-gke-serial-release-1.4/74/

Failed: [k8s.io] Rescheduler [Serial] should ensure that critical pod is scheduled in case there is no resources available {Kubernetes e2e suite}

/go/src/k8s.io/kubernetes/_output/dockerized/go/src/k8s.io/kubernetes/test/e2e/rescheduler.go:67
Expected error:
    <*errors.errorString | 0xc8208c63e0>: {
        s: "Pod name reserve-all-cpu: Gave up waiting 5m0s for 60 pods to come up",
    }
    Pod name reserve-all-cpu: Gave up waiting 5m0s for 60 pods to come up
not to have occurred
/go/src/k8s.io/kubernetes/_output/dockerized/go/src/k8s.io/kubernetes/test/e2e/rescheduler.go:52

davidopp · 2017-03-09T06:34:17Z

cc/ @piosz

Automatic merge from submit-queue (batch tested with PRs 42762, 42739, 42425, 42778) Fixed potential OutOfSync of nodeInfo. The cloned NodeInfo still share the same resource objects in cache; it may make `requestedResource` and Pods OutOfSync, for example, if the pod was deleted, the `requestedResource` is updated by Pods are not in cloned info. Found this when investigating #32531 , but seems not the root cause, as nodeInfo are readonly in predicts & priorities. Sample codes for `&(*)`: ``` package main import ( "fmt" ) type Resource struct { A int } type Node struct { Res *Resource } func main() { r1 := &Resource { A:10 } n1 := &Node{Res: r1} r2 := &(*n1.Res) r2.A = 11 fmt.Printf("%t, %d %d\n", r1==r2, r1, r2) } ``` Output: ``` true, &{11} &{11} ```

piosz · 2017-03-10T17:27:33Z

@davidopp please correct me if I'm wrong but tolerations/taints is already migrated to fields in HEAD. This means that to fix this issue we need to migrate rescheduler to use fields. I'll do it very soon.

marun · 2017-03-10T19:35:09Z

@piosz Do you think this issue indicates a regression that should block 1.6, which would require that a fix be available asap? Or is it a test-only issue that can be moved to the 1.6.1 or 1.7 milestone?

piosz · 2017-03-10T19:44:30Z

@marun the former one. See kubernetes-retired/contrib#2382

aveshagarwal · 2017-03-13T17:40:37Z

@piosz yes taints and tolerations are already moved to api fields, and the related PRs are already merged for 1.6.

Also this looks duplicate of #42686 , I think we should close one.

davidopp · 2017-03-13T20:31:10Z

Also this looks duplicate of #42686 , I think we should close one.

+1

spiffxp · 2017-03-14T03:37:37Z

#42686 was closed in favor of this issue, since we expect the bot to re-open this

ethernetdan · 2017-03-14T21:45:42Z

Status: @piosz is working on a fix

@ethernetdan

Automatic merge from submit-queue (batch tested with PRs 43106, 43110) Bumped rescheduler version to 0.3.0 fix #32531 kubernetes-retired/contrib#2474 needs to be merged first cc @ethernetdan @marun @k82cn @aveshagarwal

k8s-github-robot assigned mtaufen Sep 12, 2016

k8s-github-robot added kind/flake Categorizes issue or PR as related to a flaky test. priority/backlog Higher priority than priority/awaiting-more-evidence. labels Sep 12, 2016

This was referenced Oct 11, 2016

kubernetes-e2e-gci-gke-serial: broken test run #34087

Closed

kubernetes-e2e-gci-gke-subnet: broken test run #34902

Closed

k8s-github-robot mentioned this issue Oct 25, 2016

kubernetes-e2e-gce-serial: broken test run #34679

Closed

This was referenced Nov 24, 2016

ci-kubernetes-e2e-gce-serial: broken test run #37409

Closed

ci-kubernetes-e2e-gci-gce-serial: broken test run #37405

Closed

piosz assigned piosz and unassigned mtaufen and k82cn Mar 10, 2017

ethernetdan added kind/failing-test Categorizes issue or PR as related to a consistently or frequently failing test. and removed priority/backlog Higher priority than priority/awaiting-more-evidence. labels Mar 10, 2017

k8s-github-robot mentioned this issue Mar 12, 2017

ci-kubernetes-e2e-gci-gke-test: broken test run #40787

Closed

k8s-github-robot mentioned this issue Mar 14, 2017

ci-kubernetes-e2e-gce-serial: broken test run #43092

Closed

This was referenced Mar 14, 2017

Migrated Rescheduler to new taints kubernetes-retired/contrib#2474

Merged

Bumped rescheduler version to 0.3.0 #43106

Merged

k8s-github-robot closed this as completed in #43106 Mar 15, 2017

This was referenced Mar 18, 2017

ci-kubernetes-e2e-gci-gke-prod: broken test run #43036

Closed

ci-kubernetes-e2e-gke-serial: broken test run #43550

Closed

k8s-github-robot mentioned this issue Mar 30, 2017

ci-kubernetes-e2e-kops-aws-serial: broken test run #42602

Closed

This was referenced Apr 7, 2017

ci-kubernetes-e2e-gke-staging: broken test run #42792

Closed

ci-kubernetes-e2e-gci-gke-serial: broken test run #43434

Closed

This was referenced Apr 22, 2017

ci-kubernetes-e2e-gci-gke-test: broken test run #44699

Closed

ci-kubernetes-e2e-gci-gke-subnet: broken test run #43283

Closed

ci-kubernetes-e2e-gci-gke-staging: broken test run #43037

Closed

ci-kubernetes-e2e-gke-serial: broken test run #45139

Closed

k8s-github-robot mentioned this issue Apr 30, 2017

ci-kubernetes-e2e-gke-test: broken test run #43549

Closed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[k8s.io] Rescheduler [Serial] should ensure that critical pod is scheduled in case there is no resources available {Kubernetes e2e suite} #32531

[k8s.io] Rescheduler [Serial] should ensure that critical pod is scheduled in case there is no resources available {Kubernetes e2e suite} #32531

k8s-github-robot commented Sep 12, 2016

k8s-github-robot commented Sep 19, 2016

k8s-github-robot commented Nov 26, 2016

k8s-github-robot commented Nov 28, 2016

davidopp commented Mar 9, 2017

piosz commented Mar 10, 2017

marun commented Mar 10, 2017

piosz commented Mar 10, 2017

aveshagarwal commented Mar 13, 2017

davidopp commented Mar 13, 2017

spiffxp commented Mar 14, 2017

ethernetdan commented Mar 14, 2017

[k8s.io] Rescheduler [Serial] should ensure that critical pod is scheduled in case there is no resources available {Kubernetes e2e suite} #32531

[k8s.io] Rescheduler [Serial] should ensure that critical pod is scheduled in case there is no resources available {Kubernetes e2e suite} #32531

Comments

k8s-github-robot commented Sep 12, 2016

k8s-github-robot commented Sep 19, 2016

k8s-github-robot commented Nov 26, 2016

k8s-github-robot commented Nov 28, 2016

davidopp commented Mar 9, 2017

piosz commented Mar 10, 2017

marun commented Mar 10, 2017

piosz commented Mar 10, 2017

aveshagarwal commented Mar 13, 2017

davidopp commented Mar 13, 2017

spiffxp commented Mar 14, 2017

ethernetdan commented Mar 14, 2017