sxs-collaboration · vtommasini · May 12, 2026 · May 18, 2026 · May 21, 2026
diff --git a/src/SimulationSupport/gpr/__init__.py b/src/SimulationSupport/gpr/__init__.py
@@ -0,0 +1 @@
+from .core import *
diff --git a/src/SimulationSupport/gpr.py → src/SimulationSupport/gpr/core.py b/src/SimulationSupport/gpr.py → src/SimulationSupport/gpr/core.py
@@ -2,9 +2,9 @@
 # See LICENSE.txt for details.
 
 """
-Gaussian Process Regression Machine Learning Function Library.
-Contains all functions necessary to run the GPR Model used to predict better
-low-eccentricity orbital parameter initial guesses.
+Gaussian Process Regression machine learning library containing all core functions
+necessary to run the GPR Model used to predict better
+zero-eccentricity orbital parameter initial guesses.
 """
 
 import gpytorch
@@ -15,8 +15,8 @@
 
 class GPRegressionModel(gpytorch.models.ExactGP):
     """
-    This class derives from gpytorch.models.ExactGP an infinite number of basis functions;
-    GP is non-parametric and models functions globally; is limited only by training points
+    This class uses gpytorch.models.ExactGP to derive an infinite number of basis functions;
+    GP is non-parametric and models functions globally; it is limited only by the training points
 
     Exact GP with a mixture of RBF and Matern kernels, a linear mean function,
     and normalization capabilities for inputs and outputs.
@@ -30,7 +30,7 @@ class GPRegressionModel(gpytorch.models.ExactGP):
     def __init__(self, train_x, train_y, likelihood):
         super(GPRegressionModel, self).__init__(train_x, train_y, likelihood)
 
-        # Supports all dimensions (ie GPR can be run from 1-8 dimensions)
+        # Supports all dimensions (ie same functions are used whether system is 1 dimension or 8)
         input_dim = train_x.shape[1] if train_x.dim() > 1 else 1
 
         # Define base kernels
@@ -43,13 +43,13 @@ def __init__(self, train_x, train_y, likelihood):
         # ard_num_dims enables Automatic Relevance Determination: each input dimension gets
         # its own length scale, allowing the GP to learn which parameters most strongly influence
         # the waveform
-        self.rbf_kernel = gpytorch.kernels.RBFKernel(ard_num_dims=input_dim)
+        self.rbf_kernel    = gpytorch.kernels.RBFKernel(ard_num_dims=input_dim)
         self.matern_kernel = gpytorch.kernels.MaternKernel(
             nu=2.5, ard_num_dims=input_dim
         )
 
         # Wrap each kernel with a scale kernel - introduces learnable scaling factor
-        self.scaled_rbf = gpytorch.kernels.ScaleKernel(self.rbf_kernel)
+        self.scaled_rbf    = gpytorch.kernels.ScaleKernel(self.rbf_kernel)
         self.scaled_matern = gpytorch.kernels.ScaleKernel(self.matern_kernel)
 
         # Combine kernels - the sum of the kernels allows the model to capture more complex
@@ -61,19 +61,19 @@ def __init__(self, train_x, train_y, likelihood):
         self.mean_module = gpytorch.means.LinearMean(input_size=input_dim)
 
         # Normalization parameters - store the mean and std of the inputs and outputs
-        self.input_mean = None
-        self.input_std = None
+        self.input_mean  = None
+        self.input_std   = None
         self.output_mean = None
-        self.output_std = None
+        self.output_std  = None
 
     def set_normalization(self, input_mean, input_std, output_mean, output_std):
         """
         Store normalization parameters in the model.
         """
-        self.input_mean = input_mean
-        self.input_std = input_std
+        self.input_mean  = input_mean
+        self.input_std   = input_std
         self.output_mean = output_mean
-        self.output_std = output_std
+        self.output_std  = output_std
 
     def normalize_input(self, X):
         """
@@ -87,20 +87,17 @@ def denormalize_output(self, Y_normalized):
         """
         return (Y_normalized * self.output_std) + self.output_mean
 
-    def forward(self, x, normalize_input=False):
+    def forward(self, x):
         """
         Forward pass with optional input normalization.
 
         Args:
             x (torch.Tensor): Input data
-            normalize_input (bool): If True, normalize x using stored parameters.
 
         Returns:
             gpytorch.distributions.MultivariateNormal: Distribution for the input.
         """
-        if normalize_input:
-            x = self.normalize_input(x)
-        mean_x = self.mean_module(x)
+        mean_x  = self.mean_module(x)
         covar_x = self.covar_module(x)
         return gpytorch.distributions.MultivariateNormal(mean_x, covar_x)
 
@@ -119,16 +116,16 @@ def train_gpr_model(raw_X, raw_Y):
         gpytorch.likelihoods.GaussianLikelihood: Likelihood for the model
     """
     # Compute normalization parameters
-    input_mean = raw_X.mean(axis=0)
-    input_std = raw_X.std(axis=0)
+    input_mean  = raw_X.mean(axis=0)
+    input_std   = raw_X.std(axis=0)
     output_mean = raw_Y.mean()
-    output_std = raw_Y.std()
+    output_std  = raw_Y.std()
 
     # Normalize data column-wise; needed for all dimension > 1
-    normalized_X = (raw_X - input_mean) / input_std
+    normalized_X = (raw_X - input_mean)  / input_std
     normalized_Y = (raw_Y - output_mean) / output_std
 
-    # Ensure X is proper dimension
+    # Ensure X is the proper dimension
     if normalized_X.ndim == 1:
         normalized_X = normalized_X.reshape(-1, 1)
 
@@ -138,7 +135,7 @@ def train_gpr_model(raw_X, raw_Y):
 
     # Define the likelihood and the model
     likelihood = gpytorch.likelihoods.GaussianLikelihood()
-    model = GPRegressionModel(train_X, train_Y, likelihood)
+    model      = GPRegressionModel(train_X, train_Y, likelihood)
 
     # Store normalization parameters in the model
     model.set_normalization(input_mean, input_std, output_mean, output_std)
@@ -177,7 +174,7 @@ def train_gpr_model(raw_X, raw_Y):
     mll = gpytorch.mlls.ExactMarginalLogLikelihood(likelihood, model)
 
     # Track the best model to prevent overfitting
-    best_loss = float("inf")  # Initialize best loss as infinity
+    best_loss  = float("inf")  # Initialize best loss as infinity
     best_state = None  # Placeholder for best model state
 
     # Training loop for 200 iterations; 200 was chosen empirically for this dataset.
@@ -238,7 +235,7 @@ def predict_with_gpr_model(raw_X, model, likelihood):
     """
     # Normalize the input using the model's stored parameters
     normalized_X = (raw_X - model.input_mean) / model.input_std
-    X_tensor = torch.from_numpy(normalized_X).float()
+    X_tensor     = torch.from_numpy(normalized_X).float()
 
     # Set the model and likelihood to evaluation mode
     model.eval()
@@ -249,10 +246,10 @@ def predict_with_gpr_model(raw_X, model, likelihood):
         observed_pred = likelihood(model(X_tensor))
 
     # Denormalize the predictions
-    mean_normalized = observed_pred.mean.numpy()
+    mean_normalized   = observed_pred.mean.numpy()
     stddev_normalized = observed_pred.variance.sqrt().numpy()
 
-    mean_denormalized = model.denormalize_output(mean_normalized)
+    mean_denormalized   = model.denormalize_output(mean_normalized)
     stddev_denormalized = stddev_normalized * model.output_std
 
     return mean_denormalized, stddev_denormalized
@@ -336,3 +333,118 @@ def run_gpr_pipeline(X, Y, target_name="target", plot=True, silent=False):
         print(f"MAE goal: < 1 % of target range, lower is better")
 
     return model, likelihood, Y_pred
+
+# Function to build and save a checkpoint file
+def save_gpr_checkpoint(
+    model, likelihood, features, output_name, run_col, pn_col, X, Y, path
+):
+    """
+    Save trained GPR model, including the raw training data, so the checkpoint
+    is self-contained and reloadable without external files.
+    """
+    # Build checkpoint dictionary
+    ckpt = {
+        # All learned parameters of the GP model and the likelihood
+        "model_state_dict": model.state_dict(),  # contains all the trainable parameters (tensors)
+        "likelihood_state_dict": likelihood.state_dict(),
+        # Store metadata - describes what the model expects and predicts
+        "metadata": {
+            "input_features": features,  # extract input columns in the order GP expects - e.g. initial_separation, mass_ratio, etc
+            "output_name": output_name,  # what quantity the model is trained to predict corrections for - e.g. omega or adot
+            "base_column": [pn_col],  # baseline column that delta will be added to - e.g. spec_pn_guess_omega
+            "target_definition": {  # what the delta is
+                "formula": "run values - PN guess",
+                "run_col": run_col,
+                "pn_col": pn_col,
+            },
+        },
+        # Store normalization statistics needed for inference
+        "normalization": {
+            "input_mean": model.input_mean.tolist(),
+            "input_std": model.input_std.tolist(),
+            "output_mean": float(model.output_mean),
+            "output_std": float(model.output_std),
+        },
+        # Store raw training data as tensors for torch.save
+        "training_data": {
+            "X": torch.as_tensor(np.asarray(X), dtype=torch.float),
+            "Y": torch.as_tensor(np.asarray(Y), dtype=torch.float),
+        },
+    }
+
+    # Save entire dictionary to disk as a .pth file in the current working directory
+    torch.save(ckpt, path)
+    print(f"Saved {output_name} checkpoint → {path}")
+
+
+# Load, open, and read saved GPR from disk
+def load_gpr_checkpoint(ckpt_path):
+    """
+    Loads a saved Gaussian Process Regression (GPR) model from disk.
+    Restores model weights, likelihood, normalization parameters,
+    and the raw training data.
+
+    Args:
+        ckpt_path (str): Path to the checkpoint file.
+
+    Returns:
+        model (GPRegressionModel): Loaded GPR model.
+        likelihood (GaussianLikelihood): Loaded likelihood.
+        meta (dict): Metadata including input features.
+    """
+    # Load the checkpoint file
+    ckpt = torch.load(ckpt_path, map_location="cpu")
+
+    # Unpack metadata
+    meta     = ckpt["metadata"]
+    features = meta["input_features"]
+
+    # Restore normalization stats  - needed to normalize the saved raw
+    # training data, since the model's learned parameters are normalized
+    norm        = ckpt["normalization"]
+    input_mean  = np.array(norm["input_mean"])
+    input_std   = np.array(norm["input_std"])
+    output_mean = norm["output_mean"]
+    output_std  = norm["output_std"]
+
+    # Reconstruct the tensors and normalize
+    training_data = ckpt["training_data"]
+    raw_X = training_data["X"].numpy()
+    raw_Y = training_data["Y"].numpy()
+
+    normalized_X = (raw_X - input_mean) / input_std
+    if normalized_X.ndim == 1:
+        normalized_X = normalized_X.reshape(-1, 1)
+    normalized_Y = (raw_Y - output_mean) / output_std
+
+    train_x = torch.from_numpy(normalized_X).float()
+    train_y = torch.from_numpy(normalized_Y).float()
+
+    # Initialize likelihood and model
+    likelihood = (
+        gpytorch.likelihoods.GaussianLikelihood()
+    )  # represents assumed noise model of the data
+    model = GPRegressionModel(
+        train_x, train_y, likelihood
+    )  # constructs model object
+
+    # Load trained parameters back into model and likelihood
+    # and overwrite dummy inputs
+    model.load_state_dict(ckpt["model_state_dict"])
+    likelihood.load_state_dict(ckpt["likelihood_state_dict"])
+
+    # Restore the normalization statistics used during training
+    # so that the predictions are correctly scaled back to the original units
+    norm = ckpt["normalization"]
+    model.set_normalization(
+        input_mean  = input_mean,  # mean of training features
+        input_std   = input_std,  # standard deviation of training features
+        output_mean = output_mean,  # mean of training targets (deltas)
+        output_std  = output_std,  # standard deviation of training targets (deltas)
+    )
+
+    # Switch to evaluation mode before inference
+    model.eval()
+    likelihood.eval()
+
+    return model, likelihood, meta