[normalizer] first commit for normalizer in GPy

Conflicts: GPy/core/sparse_gp.py GPy/models/bayesian_gplvm.py
2026-04-28 14:26:23 +02:00 · 2014-08-27 12:05:13 -07:00 · 2014-08-27 12:05:13 -07:00 · 7ec0e75c0e
commit 7ec0e75c0e
parent 7ed0e70a46
6 changed files with 101 additions and 24 deletions
--- a/GPy/core/gp.py
+++ b/GPy/core/gp.py
@ -15,6 +15,7 @@ from parameterization.variational import VariationalPosterior
 from scipy.sparse.base import issparse

 import logging
+from GPy.util.normalizer import GaussianNorm
 logger = logging.getLogger("GP")

 class GP(Model):
@ -27,12 +28,17 @@ class GP(Model):
    :param likelihood: a GPy likelihood
    :param :class:`~GPy.inference.latent_function_inference.LatentFunctionInference` inference_method: The inference method to use for this GP
    :rtype: model object
+    :param Norm normalizer:
+        normalize the outputs Y.
+        Prediction will be un-normalized using this normalizer.
+        If normalizer is None, we will normalize using GaussianNorm.
+        If normalizer is False, no normalization will be done.

    .. Note:: Multiple independent outputs are allowed using columns of Y


    """
-    def __init__(self, X, Y, kernel, likelihood, inference_method=None, name='gp', Y_metadata=None):
+    def __init__(self, X, Y, kernel, likelihood, inference_method=None, name='gp', Y_metadata=None, normalizer=False):
        super(GP, self).__init__(name)

        assert X.ndim == 2
@ -44,8 +50,22 @@ class GP(Model):

        assert Y.ndim == 2
        logger.info("initializing Y")
-        if issparse(Y): self.Y = Y
-        else: self.Y = ObsAr(Y)
+
+        if normalizer is None:
+            self.normalizer = GaussianNorm()
+        elif normalizer is False:
+            self.normalizer = None
+        else:
+            self.normalizer = normalizer
+
+        if self.normalizer is not None:
+            self.normalizer.scale_by(Y)
+            self.Y_normalized = ObsAr(self.normalizer.normalize(Y))
+            self.Y = Y
+        else:
+            self.Y = ObsAr(Y)
+            self.Y_normalized = self.Y
+
        assert Y.shape[0] == self.num_data
        _, self.output_dim = self.Y.shape

@ -74,7 +94,7 @@ class GP(Model):
        self.add_parameter(self.likelihood)

    def parameters_changed(self):
-        self.posterior, self._log_marginal_likelihood, self.grad_dict = self.inference_method.inference(self.kern, self.X, self.likelihood, self.Y, self.Y_metadata)
+        self.posterior, self._log_marginal_likelihood, self.grad_dict = self.inference_method.inference(self.kern, self.X, self.likelihood, self.Y_normalized, self.Y_metadata)
        self.likelihood.update_gradients(self.grad_dict['dL_dthetaL'])
        self.kern.update_gradients_full(self.grad_dict['dL_dK'], self.X)

@ -142,7 +162,11 @@ class GP(Model):

        # now push through likelihood
        mean, var = self.likelihood.predictive_values(mu, var, full_cov, Y_metadata)
-        return mean, var
+
+        if self.normalizer is not None:
+            return self.normalizer.inverse_mean(mean), self.normalizer.inverse_variance(var)
+        else:
+            return mean, var

    def predict_quantiles(self, X, quantiles=(2.5, 97.5), Y_metadata=None):
        m, v = self._raw_predict(X,  full_cov=False)
--- a/GPy/core/sparse_gp.py
+++ b/GPy/core/sparse_gp.py
@ -34,7 +34,7 @@ class SparseGP(GP):

    """

-    def __init__(self, X, Y, Z, kernel, likelihood, inference_method=None, name='sparse gp', Y_metadata=None):
+    def __init__(self, X, Y, Z, kernel, likelihood, inference_method=None, name='sparse gp', Y_metadata=None, normalizer=False):

        #pick a sensible inference method
        if inference_method is None:
@ -48,7 +48,7 @@ class SparseGP(GP):
        self.Z = Param('inducing inputs', Z)
        self.num_inducing = Z.shape[0]

-        GP.__init__(self, X, Y, kernel, likelihood, inference_method=inference_method, name=name, Y_metadata=Y_metadata)
+        GP.__init__(self, X, Y, kernel, likelihood, inference_method=inference_method, name=name, Y_metadata=Y_metadata, normalizer=normalizer)
        logger.info("Adding Z as parameter")
        self.add_parameter(self.Z, index=0)

@ -56,7 +56,7 @@ class SparseGP(GP):
        return isinstance(self.X, VariationalPosterior)

    def parameters_changed(self):
-        self.posterior, self._log_marginal_likelihood, self.grad_dict = self.inference_method.inference(self.kern, self.X, self.Z, self.likelihood, self.Y, self.Y_metadata)
+        self.posterior, self._log_marginal_likelihood, self.grad_dict = self.inference_method.inference(self.kern, self.X, self.Z, self.likelihood, self.Y_normalized, self.Y_metadata)
        self.likelihood.update_gradients(self.grad_dict['dL_dthetaL'])
        if isinstance(self.X, VariationalPosterior):
            #gradients wrt kernel
--- a/GPy/models/bayesian_gplvm.py
+++ b/GPy/models/bayesian_gplvm.py
@ -25,9 +25,10 @@ class BayesianGPLVM(SparseGP):

    """
    def __init__(self, Y, input_dim, X=None, X_variance=None, init='PCA', num_inducing=10,
-                 Z=None, kernel=None, inference_method=None, likelihood=None, name='bayesian gplvm', mpi_comm=None, **kwargs):
+                 Z=None, kernel=None, inference_method=None, likelihood=None, name='bayesian gplvm', mpi_comm=None, normalizer=None):
        self.mpi_comm = mpi_comm
        self.__IN_OPTIMIZATION__ = False
+
        self.logger = logging.getLogger(self.__class__.__name__)
        if X == None:
            from ..util.initialization import initialize_latent
@ -49,7 +50,7 @@ class BayesianGPLVM(SparseGP):

        if kernel is None:
            self.logger.info("initializing kernel RBF")
-            kernel = kern.RBF(input_dim, lengthscale=1./fracs, ARD=True) # + kern.white(input_dim)
+            kernel = kern.RBF(input_dim, lengthscale=1./fracs, ARD=True) #+ kern.Bias(input_dim) + kern.White(input_dim)

        if likelihood is None:
            likelihood = Gaussian()
@ -71,11 +72,11 @@ class BayesianGPLVM(SparseGP):
                inference_method = VarDTC()
        if isinstance(inference_method,VarDTC_minibatch):
            inference_method.mpi_comm = mpi_comm
-                
+
        if kernel.useGPU and isinstance(inference_method, VarDTC_GPU):
            kernel.psicomp.GPU_direct = True

-        SparseGP.__init__(self, X, Y, Z, kernel, likelihood, inference_method, name, **kwargs)
+        SparseGP.__init__(self, X, Y, Z, kernel, likelihood, inference_method, name, normalizer=normalizer)
        self.logger.info("Adding X as parameter")
        self.add_parameter(self.X, index=0)

@ -91,7 +92,7 @@ class BayesianGPLVM(SparseGP):
    def set_X_gradients(self, X, X_grad):
        """Set the gradients of the posterior distribution of X in its specific form."""
        X.mean.gradient, X.variance.gradient = X_grad
-    
+
    def get_X_gradients(self, X):
        """Get the gradients of the posterior distribution of X in its specific form."""
        return X.mean.gradient, X.variance.gradient
@ -218,22 +219,22 @@ class BayesianGPLVM(SparseGP):
            del dc['N_list']
            del dc['Y_local']
        return dc
- 
+
    def __setstate__(self, state):
        return super(BayesianGPLVM, self).__setstate__(state)
-    
+
    #=====================================================
-    # The MPI parallelization 
+    # The MPI parallelization
    #     - can move to model at some point
    #=====================================================
-    
+
    def _set_params_transformed(self, p):
        if self.mpi_comm != None:
            if self.__IN_OPTIMIZATION__ and self.mpi_comm.rank==0:
                self.mpi_comm.Bcast(np.int32(1),root=0)
            self.mpi_comm.Bcast(p, root=0)
        super(BayesianGPLVM, self)._set_params_transformed(p)
-        
+
    def optimize(self, optimizer=None, start=None, **kwargs):
        self.__IN_OPTIMIZATION__ = True
        if self.mpi_comm==None:
--- a/GPy/models/gp_regression.py
+++ b/GPy/models/gp_regression.py
@ -15,17 +15,22 @@ class GPRegression(GP):
    :param X: input observations
    :param Y: observed values
    :param kernel: a GPy kernel, defaults to rbf
+    :param Norm normalizer: [False]
+
+        Normalize Y with the norm given.
+        If normalizer is False, no normalization will be done
+        If it is None, we use GaussianNorm(alization)

    .. Note:: Multiple independent outputs are allowed using columns of Y

    """

-    def __init__(self, X, Y, kernel=None, Y_metadata=None):
+    def __init__(self, X, Y, kernel=None, Y_metadata=None, normalizer=None):

        if kernel is None:
            kernel = kern.RBF(X.shape[1])

        likelihood = likelihoods.Gaussian()

-        super(GPRegression, self).__init__(X, Y, kernel, likelihood, name='GP regression', Y_metadata=Y_metadata)
+        super(GPRegression, self).__init__(X, Y, kernel, likelihood, name='GP regression', Y_metadata=Y_metadata, normalizer=normalizer)

--- a/GPy/models/sparse_gp_regression.py
+++ b/GPy/models/sparse_gp_regression.py
@ -30,7 +30,7 @@ class SparseGPRegression(SparseGP):

    """

-    def __init__(self, X, Y, kernel=None, Z=None, num_inducing=10, X_variance=None):
+    def __init__(self, X, Y, kernel=None, Z=None, num_inducing=10, X_variance=None, normalizer=None):
        num_data, input_dim = X.shape

        # kern defaults to rbf (plus white for stability)
@ -49,7 +49,7 @@ class SparseGPRegression(SparseGP):
        if not (X_variance is None):
            X = NormalPosterior(X,X_variance)

-        SparseGP.__init__(self, X, Y, Z, kernel, likelihood, inference_method=VarDTC())
+        SparseGP.__init__(self, X, Y, Z, kernel, likelihood, inference_method=VarDTC(), normalizer=normalizer)

 class SparseGPRegressionUncertainInput(SparseGP):
    """
@ -59,7 +59,7 @@ class SparseGPRegressionUncertainInput(SparseGP):

    """

-    def __init__(self, X, X_variance, Y, kernel=None, Z=None, num_inducing=10):
+    def __init__(self, X, X_variance, Y, kernel=None, Z=None, num_inducing=10, normalizer=None):
        """
        :param X: input observations
        :type X: np.ndarray (num_data x input_dim)
@ -91,5 +91,5 @@ class SparseGPRegressionUncertainInput(SparseGP):

        likelihood = likelihoods.Gaussian()

-        SparseGP.__init__(self, X, Y, Z, kernel, likelihood, X_variance=X_variance, inference_method=VarDTC())
+        SparseGP.__init__(self, X, Y, Z, kernel, likelihood, X_variance=X_variance, inference_method=VarDTC(), normalizer=normalizer)
        self.ensure_default_constraints()
--- a/GPy/util/normalizer.py
+++ b/GPy/util/normalizer.py
@ -0,0 +1,47 @@
+'''
+Created on Aug 27, 2014
+
+@author: t-mazwie
+'''
+import logging
+import numpy as np
+
+class Norm(object):
+    def __init__(self):
+        pass
+    def scale_by(self, Y):
+        """
+        Use data matrix Y as normalization space to work in.
+        """
+        raise NotImplementedError
+    def normalize(self, Y):
+        """
+        Project Y into normalized space
+        """
+        raise NotImplementedError
+    def inverse_mean(self, X):
+        """
+        Project the normalized object X into space of Y
+        """
+        raise NotImplementedError
+    def scaled(self):
+        """
+        Whether this Norm object has been initialized.
+        """
+        raise NotImplementedError
+class GaussianNorm(Norm):
+    def __init__(self):
+        self.mean = None
+        self.std = None
+    def scale_by(self, Y):
+        Y = np.ma.masked_invalid(Y, copy=False)
+        self.mean = Y.mean(0).view(np.ndarray)
+        self.std = Y.std(0).view(np.ndarray)
+    def normalize(self, Y):
+        return ((Y-self.mean)/self.std)
+    def inverse_mean(self, X):
+        return ((X*self.std)+self.mean)
+    def inverse_variance(self, var):
+        return (var*self.std**2)
+    def scaled(self):
+        return self.mean is not None and self.std is not None