Feature/MCMC (#10)

* MCMC: make step size a parameter * MCMC: increase adaption_rate for step size
icecube · Nov 18, 2022 · 7300839 · 7300839
1 parent e8f9249
commit 7300839
Show file tree

Hide file tree

Showing 2 changed files with 46 additions and 6 deletions.
diff --git a/egenerator/manager/reconstruction/modules/mcmc.py b/egenerator/manager/reconstruction/modules/mcmc.py
@@ -19,6 +19,7 @@ def __init__(self, manager, loss_module, function_cache,
                  mcmc_num_steps_between_results=0,
                  mcmc_num_parallel_iterations=1,
                  mcmc_method='HamiltonianMonteCarlo',
+                 mcmc_step_size=0.01,
                  random_seed=42,
                  verbose=True,
                  ):
@@ -59,6 +60,14 @@ def __init__(self, manager, loss_module, function_cache,
             HamiltonianMonteCarlo
             RandomWalkMetropolis
             NoUTurnSampler
+        mcmc_step_size : float or array_like or str, optional
+            The step size for the parameters may be provided as a list of
+            float for each parameter (in original physics parameter space,
+            but in log10 for variables fit in log10 if
+            `minimize_in_trafo_space` is set to true),
+            a single float for all parameters (in transformed parameter space),
+            or as a string for one of the implemented methods consisting
+            of: [].
         random_seed : int, optional
             Description
         verbose : bool, optional
@@ -125,6 +134,7 @@ def run_mcmc_on_events(initial_position, data_batch, seed):
                 num_results=mcmc_num_results,
                 num_burnin_steps=mcmc_num_burnin_steps,
                 num_steps_between_results=mcmc_num_steps_between_results,
+                step_size=mcmc_step_size,
                 num_parallel_iterations=mcmc_num_parallel_iterations,
                 parameter_tensor_name=parameter_tensor_name,
                 seed=seed)

diff --git a/egenerator/manager/source.py b/egenerator/manager/source.py
@@ -1238,6 +1238,7 @@ def run_mcmc_on_events(self, initial_position, data_batch, loss_module,
                            num_burnin_steps=100,
                            num_parallel_iterations=1,
                            num_steps_between_results=0,
+                           step_size=0.01,
                            method='HamiltonianMonteCarlo',
                            mcmc_seed=42,
                            parameter_tensor_name='x_parameters',
@@ -1284,6 +1285,14 @@ def run_mcmc_on_events(self, initial_position, data_batch, loss_module,
         num_steps_between_results : int, optional
             The number of steps between accepted results. This applies
             thinning to the sampled point and can reduce correlation.
+        step_size : float or array_like or str, optional
+            The step size for the parameters may be provided as a list of
+            float for each parameter (in original physics parameter space,
+            but in log10 for variables fit in log10 if
+            `minimize_in_trafo_space` is set to true),
+            a single float for all parameters (in transformed parameter space),
+            or as a string for one of the implemented methods consisting
+            of: [].
         method : str, optional
             The MCMC method to use:
             'HamiltonianMonteCarlo', 'RandomWalkMetropolis', ...
@@ -1337,15 +1346,32 @@ def unnormalized_log_prob(x):
                     x[i], data_batch, seed_array))
             return tf.stack(log_prob_list, axis=0)
 
+        # -----------------
         # Define step sizes
-        if minimize_in_trafo_space:
-            step_size = [[0.01 for p in range(num_params)]]
+        # -----------------
+        if isinstance(step_size, float):
+            step_size_trafo = [[
+                step_size for p in range(len(fit_parameter_list))]]
+            step_size = step_size_trafo * self.data_trafo.data[
+                parameter_tensor_name+'_std']
+
+        elif isinstance(step_size, str):
+            if step_size == 'covariance':
+                raise NotImplementedError
+            else:
+                raise ValueError('Stepsize method not understood: {}'.format(
+                    step_size))
         else:
-            # step sizes for x, y, z, zenith, azimuth, energy, time
-            step_size = [[.5, .5, .5, 0.02, 0.02, 10., 1.]]
-            if method == 'HamiltonianMonteCarlo':
-                step_size = [[.1, .1, .1, 0.01, 0.02, 10., 1.]]
+            assert len(step_size) == len(fit_parameter_list)
+            step_size = [step_size]
+            step_size_trafo = step_size / self.data_trafo.data[
+                parameter_tensor_name+'_std']
+
+        # use transformed step size if needed
+        if minimize_in_trafo_space:
+            step_size = step_size_trafo
 
+        # only select those which we are fitting
         if num_params != len(step_size):
             step_size = [[
                 s for (s, f) in zip(step_size[0], fit_parameter_list) if f
@@ -1359,7 +1385,9 @@ def unnormalized_log_prob(x):
         step_size = tf.convert_to_tensor(step_size, dtype=parameter_dtype)
         step_size = tf.reshape(step_size, [1, num_params])
 
+        # ------------------------
         # Define transition kernel
+        # ------------------------
         if method == 'HamiltonianMonteCarlo':
             adaptive_hmc = tfp.mcmc.SimpleStepSizeAdaptation(
                 tfp.mcmc.HamiltonianMonteCarlo(
@@ -1369,6 +1397,8 @@ def unnormalized_log_prob(x):
                     #     shape=(), minval=1, maxval=30,
                     #     dtype=tf.int32, seed=mcmc_seed),
                     step_size=step_size),
+                adaptation_rate=0.03,
+                reduce_fn=tfp.math.reduce_log_harmonic_mean_exp,
                 num_adaptation_steps=int(num_burnin_steps * 0.8))
 
         elif method == 'NoUTurnSampler':