rancher · mallardduck · Oct 31, 2024 · Oct 31, 2024 · Oct 31, 2024 · Oct 31, 2024
@@ -29,6 +29,9 @@ spec:
     - jsonPath: .status.conditions[?(@.type=="Ready")].message
       name: Status
       type: string
+    - jsonPath: .status.conditions[?(@.type=="InPlaceRestore")].status
+      name: In-Place
+      type: string
     name: v1
     schema:
       openAPIV3Schema:
@@ -127,6 +130,9 @@ spec:
                 type: string
               observedGeneration:
                 type: integer
+              originCluster:
+                nullable: true
+                type: string
               storageLocation:
                 nullable: true
                 type: string

@@ -6,13 +6,15 @@ import (
 )
 
 var (
-	BackupConditionReady        = "Ready"
-	BackupConditionUploaded     = "Uploaded"
-	BackupConditionReconciling  = "Reconciling"
-	BackupConditionStalled      = "Stalled"
-	RestoreConditionReconciling = "Reconciling"
-	RestoreConditionStalled     = "Stalled"
-	RestoreConditionReady       = "Ready"
+	BackupConditionReady          = "Ready"
+	BackupConditionUploaded       = "Uploaded"
+	BackupConditionReconciling    = "Reconciling"
+	BackupConditionClusterOrigin  = "HasClusterOrigin"
+	BackupConditionInPlaceRestore = "InPlaceRestore"
+	BackupConditionStalled        = "Stalled"
+	RestoreConditionReconciling   = "Reconciling"
+	RestoreConditionStalled       = "Stalled"
+	RestoreConditionReady         = "Ready"
 )
 
 // +genclient
@@ -37,6 +39,7 @@ type BackupSpec struct {
 
 type BackupStatus struct {
 	Conditions         []genericcondition.GenericCondition `json:"conditions"`
+	OriginCluster      string                              `json:"originCluster,omitempty"`
 	LastSnapshotTS     string                              `json:"lastSnapshotTs"`
 	NextSnapshotAt     string                              `json:"nextSnapshotAt"`
 	ObservedGeneration int64                               `json:"observedGeneration"`

@@ -0,0 +1,109 @@
+package backup
+
+import (
+	v1 "github.com/rancher/backup-restore-operator/pkg/apis/resources.cattle.io/v1"
+	"github.com/rancher/wrangler/v3/pkg/condition"
+)
+
+type backupClusterOriginConditionMeta struct {
+	backupName                     string
+	hasClusterOriginID             bool
+	clusterOriginID                string
+	hasCurrentOriginCondition      bool
+	currentOriginCondition         bool
+	canInPlaceRestore              bool
+	hasInPlaceRestoreCondition     bool
+	currentInPlaceRestoreCondition bool
+}
+
+func newBackupClusterOriginConditionMeta(controllerClusterID string, backup *v1.Backup) backupClusterOriginConditionMeta {
+	conditionMeta := backupClusterOriginConditionMeta{
+		backupName:                     backup.Name,
+		hasClusterOriginID:             false,
+		hasCurrentOriginCondition:      false,
+		currentOriginCondition:         false,
+		canInPlaceRestore:              false,
+		hasInPlaceRestoreCondition:     false,
+		currentInPlaceRestoreCondition: false,
+	}
+
+	originalValue := backup.Status.OriginCluster
+	conditionMeta.hasClusterOriginID = originalValue != ""
+	if conditionMeta.hasClusterOriginID {
+		conditionMeta.clusterOriginID = originalValue
+	}
+
+	currentOriginConditionString := condition.Cond(v1.BackupConditionClusterOrigin).GetStatus(backup)
+	conditionMeta.hasCurrentOriginCondition = currentOriginConditionString != ""
+	if !conditionMeta.hasCurrentOriginCondition {
+		conditionMeta.currentOriginCondition = currentOriginConditionString == "True"
+	}
+
+	if conditionMeta.hasClusterOriginID {
+		conditionMeta.canInPlaceRestore = conditionMeta.clusterOriginID == controllerClusterID
+	}
+
+	currentInPlaceRestoreString := condition.Cond(v1.BackupConditionInPlaceRestore).GetStatus(backup)
+	conditionMeta.hasInPlaceRestoreCondition = currentInPlaceRestoreString != ""
+	if !conditionMeta.hasInPlaceRestoreCondition {
+		conditionMeta.currentInPlaceRestoreCondition = currentInPlaceRestoreString == "True"
+	}
+
+	return conditionMeta
+}
+
+// prepareClusterOriginConditions helps set the cluster origin conditions and reports if anything changed in this part of status.
+func (h *handler) prepareClusterOriginConditions(backup *v1.Backup) bool {
+	conditionChanged := false
+	if !h.canUseClusterOriginStatus {
+		currentOriginConditionString := condition.Cond(v1.BackupConditionClusterOrigin).GetStatus(backup)
+		if currentOriginConditionString != "False" {
+			condition.Cond(v1.BackupConditionClusterOrigin).SetStatusBool(backup, false)
+			condition.Cond(v1.BackupConditionClusterOrigin).Message(backup, "CRD not updated to include cluster UID yet.")
+			conditionChanged = true
+		}
+		currentInPlaceRestoreString := condition.Cond(v1.BackupConditionInPlaceRestore).GetStatus(backup)
+		if currentInPlaceRestoreString != "False" {
+			condition.Cond(v1.BackupConditionInPlaceRestore).SetStatusBool(backup, false)
+			condition.Cond(v1.BackupConditionInPlaceRestore).Message(backup, "Cannot determine if in-place Restore is viable.")
+			conditionChanged = true
+		}
+
+		return conditionChanged
+	}
+
+	// TODO: We could add a fallback mode that uses filenames (and/or the annotation) when the CRD is not updated
+	conditionMeta := newBackupClusterOriginConditionMeta(h.kubeSystemNS, backup)
+
+	// Fist pass we only care to set BackupConditionClusterOrigin based on if the context is there
+	if !conditionMeta.hasCurrentOriginCondition || conditionMeta.currentOriginCondition != conditionMeta.hasClusterOriginID {
+		conditionChanged = true
+		condition.Cond(v1.BackupConditionClusterOrigin).SetStatusBool(backup, conditionMeta.hasClusterOriginID)
+
+		if conditionMeta.hasClusterOriginID {
+			condition.Cond(v1.BackupConditionClusterOrigin).Message(backup, "Backup has cluster UID attached.")
+		} else {
+			condition.Cond(v1.BackupConditionClusterOrigin).Message(backup, "No cluster UID attached to backup.")
+		}
+	}
+
+	// Second pass, we care about the specifics of the ClusterOrigin to set the InPlaceRestore condition
+	if !conditionMeta.hasClusterOriginID {
+		// When annotation is missing, we'll mark as unable to determine
+		condition.Cond(v1.BackupConditionInPlaceRestore).SetStatusBool(backup, false)
+		condition.Cond(v1.BackupConditionInPlaceRestore).Message(backup, "Unable to determine if in-place Restore is viable.")
+	}
+
+	if !conditionMeta.hasInPlaceRestoreCondition || conditionMeta.canInPlaceRestore != conditionMeta.currentInPlaceRestoreCondition {
+		conditionChanged = true
+		condition.Cond(v1.BackupConditionInPlaceRestore).SetStatusBool(backup, conditionMeta.canInPlaceRestore)
+		if conditionMeta.canInPlaceRestore {
+			condition.Cond(v1.BackupConditionInPlaceRestore).Message(backup, "In-place Restore appears viable.")
+		} else {
+			condition.Cond(v1.BackupConditionInPlaceRestore).Message(backup, "In-place Restore does not appear viable.")
+		}
+	}
+
+	// When the annotation is present and not changed
+	return conditionChanged
+}
@@ -39,7 +39,9 @@ type handler struct {
 	dynamicClient           dynamic.Interface
 	defaultBackupMountPath  string
 	defaultS3BackupLocation *v1.S3ObjectStore
-	kubeSystemNS            string
+	// TODO: rename to kubeSystemNamespaceUID; nit to improve clarity, it's not the string representation nor the NS resource
+	kubeSystemNS              string
+	canUseClusterOriginStatus bool
 }
 
 const DefaultRetentionCount = 10
@@ -56,15 +58,16 @@ func Register(
 	defaultS3 *v1.S3ObjectStore) {
 
 	controller := &handler{
-		ctx:                     ctx,
-		backups:                 backups,
-		resourceSets:            resourceSets,
-		secrets:                 secrets,
-		namespaces:              namespaces,
-		discoveryClient:         clientSet.Discovery(),
-		dynamicClient:           dynamicInterface,
-		defaultBackupMountPath:  defaultLocalBackupLocation,
-		defaultS3BackupLocation: defaultS3,
+		ctx:                       ctx,
+		backups:                   backups,
+		resourceSets:              resourceSets,
+		secrets:                   secrets,
+		namespaces:                namespaces,
+		discoveryClient:           clientSet.Discovery(),
+		dynamicClient:             dynamicInterface,
+		defaultBackupMountPath:    defaultLocalBackupLocation,
+		defaultS3BackupLocation:   defaultS3,
+		canUseClusterOriginStatus: util.VerifyBackupCrdHasClusterStatus(clientSet.ApiextensionsV1()),
 	}
 	if controller.defaultBackupMountPath != "" {
 		logrus.Infof("Default location for storing backups is %v", controller.defaultBackupMountPath)
@@ -74,12 +77,13 @@ func Register(
 	}
 
 	// Use the kube-system NS.UID as the unique ID for a cluster
-	kubeSystemNS, err := controller.namespaces.Get("kube-system", k8sv1.GetOptions{})
+	kubeSystemNamespaceUID, err := util.FetchClusterUID(namespaces)
 	if err != nil {
 		// fatal log here, because we need the kube-system ns UID while creating any backup file
 		logrus.Fatalf("Error getting namespace kube-system %v", err)
 	}
-	controller.kubeSystemNS = string(kubeSystemNS.UID)
+	// TODO: rename to kubeSystemNamespaceUID
+	controller.kubeSystemNS = kubeSystemNamespaceUID
 	// Register handlers
 	backups.OnChange(ctx, "backups", controller.OnBackupChange)
 }
@@ -94,27 +98,36 @@ func (h *handler) OnBackupChange(_ string, backup *v1.Backup) (*v1.Backup, error
 		return h.setReconcilingCondition(backup, err)
 	}
 
+	// Handle updates made on Backup CRs with existing backup files
 	if backup.Status.LastSnapshotTS != "" {
 		if backup.Spec.Schedule == "" {
 			// Backup CR was meant for one-time backup, and the backup has been completed. Probably here from UpdateStatus call
 			logrus.Infof("Backup CR %v has been processed for one-time backup, returning", backup.Name)
 			// This could also mean backup CR was updated from recurring to one-time, in which case observedGeneration needs to be updated
-			updBackupStatus := false
+			shouldUpdateStatus := false
 			if backup.Generation != backup.Status.ObservedGeneration {
 				backup.Status.ObservedGeneration = backup.Generation
-				updBackupStatus = true
+				shouldUpdateStatus = true
 			}
 			// check if the backup-type needs to be changed too
 			if backup.Status.BackupType != "One-time" {
 				backup.Status.BackupType = "One-time"
-				updBackupStatus = true
+				shouldUpdateStatus = true
 			}
-			if updBackupStatus {
+			// check if the origin cluster status needs updating
+			clusterOriginChanged := h.prepareClusterOriginConditions(backup)
+			if clusterOriginChanged {
+				shouldUpdateStatus = true
+			}
+			if shouldUpdateStatus {
 				return h.backups.UpdateStatus(backup)
 			}
 			return backup, nil
 		}
 		if backup.Status.NextSnapshotAt != "" {
+			// TODO: Verify how recurring backups work after a migration today
+			//       Then decide how/where to call prepareClusterOriginConditions for that.
+
 			currTime := time.Now().Format(time.RFC3339)
 			logrus.Infof("Next snapshot is scheduled for: %v, current time: %v", backup.Status.NextSnapshotAt, currTime)
 
@@ -173,20 +186,25 @@ func (h *handler) OnBackupChange(_ string, backup *v1.Backup) (*v1.Backup, error
 			return h.setReconcilingCondition(backup, err)
 		}
 	}
+
 	storageLocationType := backup.Status.StorageLocation
 	updateErr := retry.RetryOnConflict(retry.DefaultRetry, func() error {
 		var err error
 		backup, err = h.backups.Get(backup.Name, k8sv1.GetOptions{})
 		if err != nil {
 			return err
 		}
+		// Set the Cluster origin reference on backup
+		backup.Status.OriginCluster = h.kubeSystemNS
 		// reset conditions to remove the reconciling condition, because as per kstatus lib its presence is considered an error
 		backup.Status.Conditions = []genericcondition.GenericCondition{}
 
 		condition.Cond(v1.BackupConditionReady).SetStatusBool(backup, true)
 		condition.Cond(v1.BackupConditionReady).Message(backup, "Completed")
 		condition.Cond(v1.BackupConditionUploaded).SetStatusBool(backup, true)
 
+		h.prepareClusterOriginConditions(backup)
+
 		backup.Status.LastSnapshotTS = time.Now().Format(time.RFC3339)
 		if cronSchedule != nil {
 			nextBackupAt := cronSchedule.Next(time.Now())

@@ -59,7 +59,8 @@ func List() []crd.CRD {
 				WithColumn("Latest-Backup", ".status.filename").
 				WithColumn("ResourceSet", ".spec.resourceSetName").
 				WithCustomColumn(apiext.CustomResourceColumnDefinition{Name: "Age", Type: "date", JSONPath: ".metadata.creationTimestamp"}).
-				WithColumn("Status", ".status.conditions[?(@.type==\"Ready\")].message")
+				WithColumn("Status", ".status.conditions[?(@.type==\"Ready\")].message").
+				WithColumn("In-Place", ".status.conditions[?(@.type==\"InPlaceRestore\")].status")
 		}),
 		newCRD(&resources.Restore{}, func(c crd.CRD) crd.CRD {
 			return c.

@@ -6,9 +6,13 @@ import (
 	"os"
 	"reflect"
 
+	apiextensionsv1 "k8s.io/apiextensions-apiserver/pkg/apis/apiextensions/v1"
+	apiextensionsClientSetv1 "k8s.io/apiextensions-apiserver/pkg/client/clientset/clientset/typed/apiextensions/v1"
+
 	v1core "github.com/rancher/wrangler/v3/pkg/generated/controllers/core/v1"
 	"github.com/sirupsen/logrus"
 	k8sv1 "k8s.io/apimachinery/pkg/apis/meta/v1"
+	metav1 "k8s.io/apimachinery/pkg/apis/meta/v1"
 	"k8s.io/apimachinery/pkg/runtime/schema"
 	"k8s.io/apiserver/pkg/server/options/encryptionconfig"
 	"k8s.io/apiserver/pkg/storage/value"
@@ -74,3 +78,47 @@ func ErrList(e []error) error {
 	}
 	return nil
 }
+
+func FetchClusterUID(namespaces v1core.NamespaceController) (string, error) {
+	kubesystemNamespace, err := namespaces.Get("kube-system", k8sv1.GetOptions{})
+	if err != nil {
+		return "", err
+	}
+
+	return string(kubesystemNamespace.UID), nil
+}
+
+// Define the GroupVersionResource for CRDs
+var crdGVR = schema.GroupVersionResource{
+	Group:    "apiextensions.k8s.io",
+	Version:  "v1",
+	Resource: "customresourcedefinitions",
+}
+
+func getCRDDefinition(dynamicClient apiextensionsClientSetv1.ApiextensionsV1Interface, crdName string) (*apiextensionsv1.CustomResourceDefinition, error) {
+	crd, err := dynamicClient.CustomResourceDefinitions().Get(context.TODO(), crdName, metav1.GetOptions{})
+	if err != nil {
+		return nil, err
+	}
+	return crd, nil
+}
+
+func VerifyBackupCrdHasClusterStatus(client apiextensionsClientSetv1.ApiextensionsV1Interface) bool {
+	crdName := "backups.resources.cattle.io"
+
+	crd, err := getCRDDefinition(client, crdName)
+	if err != nil {
+		logrus.Infof("Error fetching CRD: %v", err)
+		return false
+	}
+
+	// Inspect the status schema, for example
+	_, found := crd.Spec.Versions[0].Schema.OpenAPIV3Schema.Properties["status"].Properties["originCluster"]
+	if found {
+		logrus.Debugf("Status schema contains `originCluster` on CRD `%s`.\n", crdName)
+		return true
+	}
+
+	logrus.Debugf("`originCluster` not found on status schema for CRD `%s`.\n", crdName)
+	return false
+}