Zookeeper Operator upgrade fails because of readiness check in deploy file #101

pbelgundi · 2019-11-20T10:07:55Z

Tried upgrading zookeeper-operator from version 0.2.4 to 0.2.5-rc0 and upgrade got stuck when this readiness check for specified in the operator manifest:

 readinessProbe:
            exec:
              command:
                - stat
                - /tmp/operator-sdk-ready
            initialDelaySeconds: 4
            periodSeconds: 10
            failureThreshold: 1

On removing this check, initial deployment and upgrade both completed successfully.
This check needs to be removed/corrected in operator deployment manifest

The text was updated successfully, but these errors were encountered:

anishakj · 2020-03-27T10:35:47Z

In the case of rolling update of zookeeper-operator, a deadlock occurs that prevents the new pod to become the leader.
Rolling update works as follows:

a. A new Pod is created
b. A new Pod tries to be the leader with call leader.Become function.
c. But the new Pod keeps waiting, as the old Pod is now the leader
d. If a new Pod is not the leader, file /tmp/operator-sdk-ready is will be not created
e. ReadinessProbe will not succeed without file /tmp/operator-sdk-ready
f. This will create a deadlock and rolling updates get stopped.

This can be fixed by removing the readiness probe check from the operator. More details about this can be found at operator-framework/operator-sdk#932

RaulGracia changed the title ~~Zookeeper Operator upgrade fails becuase of readiness check in deploy file~~ Zookeeper Operator upgrade fails because of readiness check in deploy file Nov 20, 2019

pbelgundi assigned Prabhaker24 Mar 3, 2020

pbelgundi assigned anishakj and unassigned Prabhaker24 Mar 26, 2020

pbelgundi added area/upgrade zookeeper operator upgrade or zookeeper upgrade Priority-P1 labels Mar 26, 2020

anishakj mentioned this issue Mar 27, 2020

Zookeeper operator upgrade is failing #146

Closed

anishakj mentioned this issue Mar 27, 2020

Issue 101: Zookeeper Operator upgrade fails because of readiness check in deploy file #152

Merged

pbelgundi closed this as completed in #152 Mar 30, 2020

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Zookeeper Operator upgrade fails because of readiness check in deploy file #101

Zookeeper Operator upgrade fails because of readiness check in deploy file #101

pbelgundi commented Nov 20, 2019

anishakj commented Mar 27, 2020

Zookeeper Operator upgrade fails because of readiness check in deploy file #101

Zookeeper Operator upgrade fails because of readiness check in deploy file #101

Comments

pbelgundi commented Nov 20, 2019

anishakj commented Mar 27, 2020