[missing data] general implementation for subsetting data

2026-06-20 15:38:08 +02:00 · 2014-10-08 12:03:51 +01:00 · 2014-10-08 12:03:51 +01:00 · fa7807ee6f
commit fa7807ee6f
parent d93fac8c13
7 changed files with 329 additions and 108 deletions
--- a/GPy/inference/latent_function_inference/var_dtc.py
+++ b/GPy/inference/latent_function_inference/var_dtc.py
@ -62,7 +62,9 @@ class VarDTC(LatentFunctionInference):
    def get_VVTfactor(self, Y, prec):
        return Y * prec # TODO chache this, and make it effective

-    def inference(self, kern, X, Z, likelihood, Y, Y_metadata=None):
+
+
+    def inference(self, kern, X, Z, likelihood, Y, Y_metadata=None, Lm=None, dL_dKmm=None):

        _, output_dim = Y.shape
        uncertain_inputs = isinstance(X, VariationalPosterior)
@ -84,8 +86,8 @@ class VarDTC(LatentFunctionInference):

        Kmm = kern.K(Z).copy()
        diag.add(Kmm, self.const_jitter)
-        Lm = jitchol(Kmm)
-
+        if Lm is None:
+            Lm = jitchol(Kmm)

        # The rather complex computations of A, and the psi stats
        if uncertain_inputs:
@ -100,7 +102,6 @@ class VarDTC(LatentFunctionInference):
        else:
            psi0 = kern.Kdiag(X)
            psi1 = kern.K(X, Z)
-            psi2 = None
            if het_noise:
                tmp = psi1 * (np.sqrt(beta.reshape(num_data, 1)))
            else:
@ -122,11 +123,12 @@ class VarDTC(LatentFunctionInference):
        delit = tdot(_LBi_Lmi_psi1Vf)
        data_fit = np.trace(delit)
        DBi_plus_BiPBi = backsub_both_sides(LB, output_dim * np.eye(num_inducing) + delit)
-        delit = -0.5 * DBi_plus_BiPBi
-        delit += -0.5 * B * output_dim
-        delit += output_dim * np.eye(num_inducing)
-        # Compute dL_dKmm
-        dL_dKmm = backsub_both_sides(Lm, delit)
+        if dL_dKmm is None:
+            delit = -0.5 * DBi_plus_BiPBi
+            delit += -0.5 * B * output_dim
+            delit += output_dim * np.eye(num_inducing)
+            # Compute dL_dKmm
+            dL_dKmm = backsub_both_sides(Lm, delit)

        # derivatives of L w.r.t. psi
        dL_dpsi0, dL_dpsi1, dL_dpsi2 = _compute_dL_dpsi(num_inducing, num_data, output_dim, beta, Lm,
@ -208,6 +210,7 @@ class VarDTCMissingData(LatentFunctionInference):
            inan = np.isnan(Y)
            has_none = inan.any()
            self._inan = ~inan
+            inan = self._inan
        else:
            inan = self._inan
            has_none = True
@ -241,7 +244,7 @@ class VarDTCMissingData(LatentFunctionInference):
            self._subarray_indices = [[slice(None),slice(None)]]
            return [Y], [(Y**2).sum()]

-    def inference(self, kern, X, Z, likelihood, Y, Y_metadata=None):
+    def inference(self, kern, X, Z, likelihood, Y, Y_metadata=None, Lm=None):
        if isinstance(X, VariationalPosterior):
            uncertain_inputs = True
            psi0_all = kern.psi0(Z, X)
@ -260,7 +263,7 @@ class VarDTCMissingData(LatentFunctionInference):
        dL_dpsi0_all = np.zeros(Y.shape[0])
        dL_dpsi1_all = np.zeros((Y.shape[0], num_inducing))
        if uncertain_inputs:
-            dL_dpsi2_all = np.zeros((num_inducing, num_inducing))
+            dL_dpsi2_all = np.zeros((Y.shape[0], num_inducing, num_inducing))

        dL_dR = 0
        woodbury_vector = np.zeros((num_inducing, Y.shape[1]))
@ -271,31 +274,31 @@ class VarDTCMissingData(LatentFunctionInference):
        Kmm = kern.K(Z).copy()
        diag.add(Kmm, self.const_jitter)
        #factor Kmm
-        Lm = jitchol(Kmm)
+        if Lm is None:
+            Lm = jitchol(Kmm)
        if uncertain_inputs: LmInv = dtrtri(Lm)

-        size = Y.shape[1]
+        size = len(Ys)
        next_ten = 0
-
        for i, [y, v, trYYT] in enumerate(itertools.izip(Ys, self._inan.T, traces)):
            if ((i+1.)/size) >= next_ten:
                logger.info('inference {:> 6.1%}'.format((i+1.)/size))
                next_ten += .1
            if het_noise: beta = beta_all[i]
            else: beta = beta_all
-
            VVT_factor = (y*beta)
            output_dim = 1#len(ind)

            psi0 = psi0_all[v]
            psi1 = psi1_all[v, :]
-            if uncertain_inputs: psi2 = kern.psi2(Z, X[v, :])
+            if uncertain_inputs:
+                psi2 = kern.psi2(Z, X[v, :])
            else: psi2 = None
            num_data = psi1.shape[0]

            if uncertain_inputs:
                if het_noise: psi2_beta = psi2 * (beta.flatten().reshape(num_data, 1, 1)).sum(0)
-                else: psi2_beta = psi2 * beta
+                else: psi2_beta = psi2 * (beta)
                A = LmInv.dot(psi2_beta.dot(LmInv.T))
            else:
                if het_noise: tmp = psi1 * (np.sqrt(beta.reshape(num_data, 1)))
@ -330,11 +333,11 @@ class VarDTCMissingData(LatentFunctionInference):
            dL_dpsi0_all[v] += dL_dpsi0
            dL_dpsi1_all[v, :] += dL_dpsi1
            if uncertain_inputs:
-                dL_dpsi2_all += dL_dpsi2
+                dL_dpsi2_all[v, :, :] += dL_dpsi2

            # log marginal likelihood
            log_marginal += _compute_log_marginal_likelihood(likelihood, num_data, output_dim, beta, het_noise,
-                psi0, A, LB, trYYT, data_fit,VVT_factor)
+                psi0, A, LB, trYYT, data_fit, VVT_factor)

            #put the gradients in the right places
            dL_dR += _compute_dL_dR(likelihood,
@ -393,7 +396,6 @@ def _compute_dL_dpsi(num_inducing, num_data, output_dim, beta, Lm, VVT_factor, C
            # subsume back into psi1 (==Kmn)
            dL_dpsi1 += 2.*np.dot(psi1, dL_dpsi2)
            dL_dpsi2 = None
-
    return dL_dpsi0, dL_dpsi1, dL_dpsi2