changes in GPLVM plotting

2026-05-05 01:32:40 +02:00 · 2013-03-21 11:05:17 +00:00 · 2013-03-21 11:05:17 +00:00 · 8ab1cfaf65
commit 8ab1cfaf65
parent c44493077a
3 changed files with 84 additions and 25 deletions
--- a/GPy/inference/SGD.py
+++ b/GPy/inference/SGD.py
@ -3,6 +3,7 @@ import scipy as sp
 import scipy.sparse
 from optimization import Optimizer
 from scipy import linalg, optimize
 import pylab as plt
 import copy
 import sys
@ -31,6 +32,16 @@ class opt_SGD(Optimizer):
        self.batch_size = batch_size
        self.self_paced = self_paced
        self.center = center
        self.param_traces = [('noise',[])]
        if len([p for p in self.model.kern.parts if p.name == 'bias']) == 1:
            self.param_traces.append(('bias',[]))
        if len([p for p in self.model.kern.parts if p.name == 'linear']) == 1:
            self.param_traces.append(('linear',[]))
        if len([p for p in self.model.kern.parts if p.name == 'rbf']) == 1:
            self.param_traces.append(('rbf_var',[]))
        self.param_traces = dict(self.param_traces)
        self.fopt_trace = []
        num_params = len(self.model._get_params())
        if isinstance(self.learning_rate, float):
@ -48,6 +59,18 @@ class opt_SGD(Optimizer):
        status += "Time elapsed: \t\t\t %s\n" % self.time
        return status
    def plot_traces(self):
        plt.figure()
        plt.subplot(211)
        plt.title('Parameters')
        for k in self.param_traces.keys():
            plt.plot(self.param_traces[k], label=k)
        plt.legend(loc=0)
        plt.subplot(212)
        plt.title('Objective function')
        plt.plot(self.fopt_trace)
    def non_null_samples(self, data):
        return (np.isnan(data).sum(axis=1) == 0)
@ -128,25 +151,37 @@ class opt_SGD(Optimizer):
    def step_with_missing_data(self, f_fp, X, step, shapes, sparse_matrix):
        N, Q = X.shape
        if not sparse_matrix:
            Y = self.model.likelihood.Y
            samples = self.non_null_samples(self.model.likelihood.Y)
            self.model.N = samples.sum()
-            self.model.likelihood.Y = self.model.likelihood.Y[samples]
+
            if self.center:
                self.model.likelihood._mean = Y[samples].mean()
                self.model.likelihood._std = Y[samples].std()
            self.model.likelihood.set_data(Y[samples])
        else:
            samples = self.model.likelihood.Y.nonzero()[0]
            self.model.N = len(samples)
-            self.model.likelihood.Y = np.asarray(self.model.likelihood.Y[samples].todense(), dtype = np.float64)
+            Y = np.asarray(self.model.likelihood.Y[samples].todense(), dtype = np.float64)
            if self.center:
                self.model.likelihood._mean = Y.mean()
                self.model.likelihood._std = Y.std()
-        self.model.likelihood.N = self.model.N
+            self.model.likelihood.set_data(Y)
        # self.model.likelihood.N = self.model.N
        j = self.subset_parameter_vector(self.x_opt, samples, shapes)
        self.model.X = X[samples]
        if self.model.N == 0 or self.model.likelihood.Y.std() == 0.0:
            return 0, step, self.model.N
-        if self.center:
+        # if self.center:
-            self.model.likelihood.Y -= self.model.likelihood.Y.mean()
+        #     self.model.likelihood.Y -= self.model.likelihood.Y.mean()
-            self.model.likelihood.Y /= self.model.likelihood.Y.std()
+        #     self.model.likelihood.Y /= self.model.likelihood.Y.std()
        model_name = self.model.__class__.__name__
@ -154,13 +189,13 @@ class opt_SGD(Optimizer):
            self.model.likelihood.trYYT = np.sum(np.square(self.model.likelihood.Y))
        b, p = self.shift_constraints(j)
        momentum_term = self.momentum * step[j]
        f, fp = f_fp(self.x_opt[j])
-        step[j] = self.learning_rate[j] * fp
+        # momentum_term = self.momentum * step[j]
-        self.x_opt[j] -= step[j] + momentum_term
+        # step[j] = self.learning_rate[j] * fp
        # self.x_opt[j] -= step[j] + momentum_term
        step[j] = self.momentum * step[j] + self.learning_rate[j] * fp
        self.x_opt[j] -= step[j]
        self.restore_constraints(b, p)
        return f, step, self.model.N
@ -177,10 +212,14 @@ class opt_SGD(Optimizer):
            missing_data = self.check_for_missing(self.model.likelihood.Y)
        self.model.likelihood.YYT = None
        self.model.likelihood.trYYT = None
        self.model.likelihood._mean = 0.0
        self.model.likelihood._std = 1.0
        num_params = self.model._get_params()
        step = np.zeros_like(num_params)
        step = np.zeros_like(num_params)
        for it in range(self.iterations):
            if it == 0 or self.self_paced is False:
                features = np.random.permutation(Y.shape[1])
            else:
@ -195,17 +234,21 @@ class opt_SGD(Optimizer):
            for j in features:
                count += 1
                self.model.D = len(j)
-                self.model.likelihood.Y = Y[:, j]
+                self.model.likelihood.D = len(j)
                self.model.likelihood.set_data(Y[:, j])
                if missing_data or sparse_matrix:
                    shapes = self.get_param_shapes(N, Q)
                    f, step, Nj = self.step_with_missing_data(f_fp, X, step, shapes, sparse_matrix)
                else:
                    Nj = N
-                    momentum_term = self.momentum * step # compute momentum using update(t-1)
+                    # momentum_term = self.momentum * step # compute momentum using update(t-1)
                    f, fp = f_fp(self.x_opt)
-                    step = self.learning_rate * fp # compute update(t)
+                    # step = self.learning_rate * fp # compute update(t)
-                    self.x_opt -= step + momentum_term
+                    # self.x_opt -= step + momentum_term
                    step = self.momentum * step + self.learning_rate * fp
                    self.x_opt -= step
                if self.messages == 2:
                    noise = np.exp(self.x_opt)[-1]
@ -216,12 +259,19 @@ class opt_SGD(Optimizer):
                NLL.append(f)
                self.fopt_trace.append(f)
                for k in self.param_traces.keys():
                    self.param_traces[k].append(self.model.get(k)[0])
            # should really be a sum(), but earlier samples in the iteration will have a very crappy ll
            self.f_opt = np.mean(NLL)
            self.model.N = N
            self.model.X = X
            self.model.D = D
            self.model.likelihood.N = N
            self.model.likelihood.D = D
            self.model.likelihood.Y = Y
            # self.model.Youter = np.dot(Y, Y.T)
--- a/GPy/models/GPLVM.py
+++ b/GPy/models/GPLVM.py
@ -68,6 +68,12 @@ class GPLVM(GP):
        util.plot.Tango.reset()
        # this goes against the current standard in GPy, which currently is to not create
        # figures in the plot() functions. I think the standard should be changed in order
        # to accomodate cases like this
        fig = pb.figure()
        ax = fig.add_subplot(111)
        if labels is None:
            labels = np.ones(self.N)
        if which_indices is None:
@ -86,15 +92,17 @@ class GPLVM(GP):
                    input_1, input_2 = np.argsort(k.lengthscale)[:2]
                elif k.name=='linear':
                    input_1, input_2 = np.argsort(k.variances)[::-1][:2]
        else:
            input_1, input_2 = which_indices
        #first, plot the output variance as a function of the latent space
        Xtest, xx,yy,xmin,xmax = util.plot.x_frame2D(self.X[:,[input_1, input_2]],resolution=resolution)
        Xtest_full = np.zeros((Xtest.shape[0], self.X.shape[1]))
        Xtest_full[:, :2] = Xtest
        mu, var, low, up = self.predict(Xtest_full)
-	var = var[:, :2]
+        var = var[:, :1] # FIXME: this was a :2
-        pb.imshow(var.reshape(resolution,resolution).T[::-1,:],extent=[xmin[0],xmax[0],xmin[1],xmax[1]],cmap=pb.cm.binary,interpolation='bilinear')
+        pb.imshow(var.reshape(resolution,resolution).T[::-1,:],
-
+                  extent=[xmin[0], xmax[0], xmin[1], xmax[1]], cmap=pb.cm.binary,interpolation='bilinear')
        for i,ul in enumerate(np.unique(labels)):
            if type(ul) is np.string_:
@ -121,5 +129,6 @@ class GPLVM(GP):
        pb.xlim(xmin[0],xmax[0])
        pb.ylim(xmin[1],xmax[1])
-
+        pb.grid(b=False) # remove the grid if present, it doesn't look good
        ax.set_aspect('auto') # set a nice aspect ratio
        return input_1, input_2