GPy/GPy/examples/dimensionality_reduction.py

# Copyright (c) 2012, GPy authors (see AUTHORS.txt).
# Licensed under the BSD 3-clause license (see LICENSE.txt)

import numpy as np
import pylab as pb
from matplotlib import pyplot as plt, pyplot

import GPy
from GPy.models.mrd import MRD

default_seed = np.random.seed(123344)

def BGPLVM(seed=default_seed):
    N = 10
    M = 3
    Q = 2
    D = 4
    # generate GPLVM-like data
    X = np.random.rand(N, Q)
    k = GPy.kern.rbf(Q) + GPy.kern.white(Q, 0.00001)
    K = k.K(X)
    Y = np.random.multivariate_normal(np.zeros(N), K, D).T

    k = GPy.kern.linear(Q, ARD=True) + GPy.kern.white(Q)
    # k = GPy.kern.rbf(Q) + GPy.kern.rbf(Q) + GPy.kern.white(Q)
    # k = GPy.kern.rbf(Q) + GPy.kern.bias(Q) + GPy.kern.white(Q, 0.00001)
    # k = GPy.kern.rbf(Q, ARD = False)  + GPy.kern.white(Q, 0.00001)

    m = GPy.models.Bayesian_GPLVM(Y, Q, kernel=k, M=M)
    m.constrain_positive('(rbf|bias|noise|white|S)')
    # m.constrain_fixed('S', 1)

    # pb.figure()
    # m.plot()
    # pb.title('PCA initialisation')
    # pb.figure()
    # m.optimize(messages = 1)
    # m.plot()
    # pb.title('After optimisation')
    m.ensure_default_constraints()
    m.randomize()
    m.checkgrad(verbose=1)

    return m

def GPLVM_oil_100(optimize=True, M=15):
    data = GPy.util.datasets.oil_100()

    # create simple GP model
    kernel = GPy.kern.rbf(6, ARD=True) + GPy.kern.bias(6)
    m = GPy.models.GPLVM(data['X'], 6, kernel=kernel, M=M)
    m.data_labels = data['Y'].argmax(axis=1)

    # optimize
    m.ensure_default_constraints()
    if optimize:
        m.optimize('scg', messages=1)

    # plot
    print(m)
    m.plot_latent(labels=m.data_labels)
    return m

def BGPLVM_oil(optimize=True, N=100, Q=10, M=15):
    data = GPy.util.datasets.oil()

    # create simple GP model
    kernel = GPy.kern.rbf(Q, ARD=True) + GPy.kern.bias(Q) + GPy.kern.white(Q, 0.001)
    m = GPy.models.Bayesian_GPLVM(data['X'][:N], Q, kernel=kernel, M=M)
    m.data_labels = data['Y'][:N].argmax(axis=1)

    # optimize
    if optimize:
        m.constrain_fixed('noise', 0.05)
        m.ensure_default_constraints()
        m.optimize('scg', messages=1)
        m.unconstrain('noise')
        m.constrain_positive('noise')
        m.optimize('scg', messages=1)
    else:
        m.ensure_default_constraints()

    # plot
    print(m)
    m.plot_latent(labels=m.data_labels)
    pb.figure()
    pb.bar(np.arange(m.kern.D), 1. / m.input_sensitivity())
    return m

def oil_100():
    data = GPy.util.datasets.oil_100()
    m = GPy.models.GPLVM(data['X'], 2)

    # optimize
    m.ensure_default_constraints()
    m.optimize(messages=1, max_iters=2)

    # plot
    print(m)
    # m.plot_latent(labels=data['Y'].argmax(axis=1))
    return m

def mrd_simulation():
    # num = 2
    ard1 = np.array([1., 1, 0, 0], dtype=float)
    ard2 = np.array([0., 1, 1, 0], dtype=float)
    ard1[ard1 == 0] = 1E-10
    ard2[ard2 == 0] = 1E-10

    ard1i = 1. / ard1
    ard2i = 1. / ard2

    # make_params = lambda ard: np.hstack([[1], ard, [1, .3]])

    D1, D2, N, M, Q = 50, 100, 150, 15, 4
    X = np.random.randn(N, Q)

    k = GPy.kern.rbf(Q, ARD=True, lengthscale=ard1i) + GPy.kern.bias(Q, 0) + GPy.kern.white(Q, 0.0001)
    Y1 = np.random.multivariate_normal(np.zeros(N), k.K(X), D1).T
    Y1 -= Y1.mean(0)

    k = GPy.kern.rbf(Q, ARD=True, lengthscale=ard2i) + GPy.kern.bias(Q, 0) + GPy.kern.white(Q, 0.0001)
    Y2 = np.random.multivariate_normal(np.zeros(N), k.K(X), D2).T
    Y2 -= Y2.mean(0)

    k = GPy.kern.rbf(Q, ARD=True) + GPy.kern.bias(Q) + GPy.kern.white(Q, 1.0)

    m = MRD(Y1, Y2, Q=Q, M=M, kernel=k, _debug=False)
    m.ensure_default_constraints()

    fig = pyplot.figure("expected", figsize=(8, 3))
    ax = fig.add_subplot(121)
    ax.bar(np.arange(ard1.size) + .1, ard1)
    ax = fig.add_subplot(122)
    ax.bar(np.arange(ard2.size) + .1, ard2)

    return m

def brendan_faces():
    data = GPy.util.datasets.brendan_faces()
    Y = data['Y'][0:-1:10, :]
    m = GPy.models.GPLVM(data['Y'], 2)

    # optimize
    m.ensure_default_constraints()
    m.optimize(messages=1, max_f_eval=10000)

    ax = m.plot_latent()
    y = m.likelihood.Y[0, :]
    data_show = GPy.util.visualize.image_show(y[None, :], dimensions=(20, 28), transpose=True, invert=False, scale=False)
    lvm_visualizer = GPy.util.visualize.lvm(m, data_show, ax)
    raw_input('Press enter to finish')
    plt.close('all')

    return m

def stick():
    data = GPy.util.datasets.stick()
    m = GPy.models.GPLVM(data['Y'], 2)

    # optimize
    m.ensure_default_constraints()
    m.optimize(messages=1, max_f_eval=10000)

    ax = m.plot_latent()
    y = m.likelihood.Y[0, :]
    data_show = GPy.util.visualize.stick_show(y[None, :], connect=data['connect'])
    lvm_visualizer = GPy.util.visualize.lvm(m, data_show, ax)
    raw_input('Press enter to finish')
    plt.close('all')

    return m


def BGPLVM_oil():
    data = GPy.util.datasets.oil()
    Y, X = data['Y'], data['X']
    X -= X.mean(axis=0)
    X /= X.std(axis=0)

    Q = 10
    M = 30

    kernel = GPy.kern.rbf(Q, ARD=True) + GPy.kern.bias(Q) + GPy.kern.white(Q)
    m = GPy.models.Bayesian_GPLVM(X, Q, kernel=kernel, M=M)
    # m.scale_factor = 100.0
    m.constrain_positive('(white|noise|bias|X_variance|rbf_variance|rbf_length)')
    from sklearn import cluster
    km = cluster.KMeans(M, verbose=10)
    Z = km.fit(m.X).cluster_centers_
    # Z = GPy.util.misc.kmm_init(m.X, M)
    m.set('iip', Z)
    m.set('bias', 1e-4)
    # optimize
    # m.ensure_default_constraints()

    import pdb; pdb.set_trace()
    m.optimize('tnc', messages=1)
    print m
    m.plot_latent(labels=data['Y'].argmax(axis=1))
    return m
examples directory organized. 2013-03-11 14:05:56 +00:00			`# Copyright (c) 2012, GPy authors (see AUTHORS.txt).`
			`# Licensed under the BSD 3-clause license (see LICENSE.txt)`

			`import numpy as np`
			`import pylab as pb`
kern plotting with axisa 2013-04-11 15:47:18 +01:00			`from matplotlib import pyplot as plt, pyplot`
Further edits on visualization code for faces example. 2013-04-02 02:20:53 +02:00
examples directory organized. 2013-03-11 14:05:56 +00:00			`import GPy`
first trivial model touches 2013-04-11 14:54:25 +01:00			`from GPy.models.mrd import MRD`
examples directory organized. 2013-03-11 14:05:56 +00:00
			`default_seed = np.random.seed(123344)`

first trivial model touches 2013-04-11 14:54:25 +01:00			`def BGPLVM(seed=default_seed):`
examples directory organized. 2013-03-11 14:05:56 +00:00			`N = 10`
			`M = 3`
			`Q = 2`
			`D = 4`
first trivial model touches 2013-04-11 14:54:25 +01:00			`# generate GPLVM-like data`
examples directory organized. 2013-03-11 14:05:56 +00:00			`X = np.random.rand(N, Q)`
			`k = GPy.kern.rbf(Q) + GPy.kern.white(Q, 0.00001)`
			`K = k.K(X)`
first trivial model touches 2013-04-11 14:54:25 +01:00			`Y = np.random.multivariate_normal(np.zeros(N), K, D).T`
examples directory organized. 2013-03-11 14:05:56 +00:00
first trivial model touches 2013-04-11 14:54:25 +01:00			`k = GPy.kern.linear(Q, ARD=True) + GPy.kern.white(Q)`
examples directory organized. 2013-03-11 14:05:56 +00:00			`# k = GPy.kern.rbf(Q) + GPy.kern.rbf(Q) + GPy.kern.white(Q)`
			`# k = GPy.kern.rbf(Q) + GPy.kern.bias(Q) + GPy.kern.white(Q, 0.00001)`
			`# k = GPy.kern.rbf(Q, ARD = False) + GPy.kern.white(Q, 0.00001)`

first trivial model touches 2013-04-11 14:54:25 +01:00			`m = GPy.models.Bayesian_GPLVM(Y, Q, kernel=k, M=M)`
examples directory organized. 2013-03-11 14:05:56 +00:00			`m.constrain_positive('(rbf\|bias\|noise\|white\|S)')`
			`# m.constrain_fixed('S', 1)`

			`# pb.figure()`
			`# m.plot()`
			`# pb.title('PCA initialisation')`
			`# pb.figure()`
			`# m.optimize(messages = 1)`
			`# m.plot()`
			`# pb.title('After optimisation')`
			`m.ensure_default_constraints()`
			`m.randomize()`
first trivial model touches 2013-04-11 14:54:25 +01:00			`m.checkgrad(verbose=1)`
examples directory organized. 2013-03-11 14:05:56 +00:00
			`return m`

first trivial model touches 2013-04-11 14:54:25 +01:00			`def GPLVM_oil_100(optimize=True, M=15):`
added simple BGPLVM_oil demo 2013-04-09 15:43:06 +01:00			`data = GPy.util.datasets.oil_100()`

			`# create simple GP model`
first trivial model touches 2013-04-11 14:54:25 +01:00			`kernel = GPy.kern.rbf(6, ARD=True) + GPy.kern.bias(6)`
various work on BGPLVM oil demo 2013-04-10 09:28:58 +01:00			`m = GPy.models.GPLVM(data['X'], 6, kernel=kernel, M=M)`
added simple BGPLVM_oil demo 2013-04-09 15:43:06 +01:00			`m.data_labels = data['Y'].argmax(axis=1)`

			`# optimize`
			`m.ensure_default_constraints()`
			`if optimize:`
first trivial model touches 2013-04-11 14:54:25 +01:00			`m.optimize('scg', messages=1)`
added simple BGPLVM_oil demo 2013-04-09 15:43:06 +01:00
			`# plot`
			`print(m)`
			`m.plot_latent(labels=m.data_labels)`
			`return m`

first trivial model touches 2013-04-11 14:54:25 +01:00			`def BGPLVM_oil(optimize=True, N=100, Q=10, M=15):`
various work on BGPLVM oil demo 2013-04-10 09:28:58 +01:00			`data = GPy.util.datasets.oil()`
examples directory organized. 2013-03-11 14:05:56 +00:00
			`# create simple GP model`
first trivial model touches 2013-04-11 14:54:25 +01:00			`kernel = GPy.kern.rbf(Q, ARD=True) + GPy.kern.bias(Q) + GPy.kern.white(Q, 0.001)`
			`m = GPy.models.Bayesian_GPLVM(data['X'][:N], Q, kernel=kernel, M=M)`
various work on BGPLVM oil demo 2013-04-10 09:28:58 +01:00			`m.data_labels = data['Y'][:N].argmax(axis=1)`

examples directory organized. 2013-03-11 14:05:56 +00:00			`# optimize`
added simple BGPLVM_oil demo 2013-04-09 15:43:06 +01:00			`if optimize:`
first trivial model touches 2013-04-11 14:54:25 +01:00			`m.constrain_fixed('noise', 0.05)`
various work on BGPLVM oil demo 2013-04-10 09:28:58 +01:00			`m.ensure_default_constraints()`
first trivial model touches 2013-04-11 14:54:25 +01:00			`m.optimize('scg', messages=1)`
various work on BGPLVM oil demo 2013-04-10 09:28:58 +01:00			`m.unconstrain('noise')`
			`m.constrain_positive('noise')`
first trivial model touches 2013-04-11 14:54:25 +01:00			`m.optimize('scg', messages=1)`
various work on BGPLVM oil demo 2013-04-10 09:28:58 +01:00			`else:`
			`m.ensure_default_constraints()`
examples directory organized. 2013-03-11 14:05:56 +00:00
			`# plot`
			`print(m)`
various work on BGPLVM oil demo 2013-04-10 09:28:58 +01:00			`m.plot_latent(labels=m.data_labels)`
			`pb.figure()`
first trivial model touches 2013-04-11 14:54:25 +01:00			`pb.bar(np.arange(m.kern.D), 1. / m.input_sensitivity())`
examples directory organized. 2013-03-11 14:05:56 +00:00			`return m`
Further edits on visualization code for faces example. 2013-04-02 02:20:53 +02:00
			`def oil_100():`
			`data = GPy.util.datasets.oil_100()`
			`m = GPy.models.GPLVM(data['X'], 2)`

			`# optimize`
			`m.ensure_default_constraints()`
			`m.optimize(messages=1, max_iters=2)`

			`# plot`
			`print(m)`
first trivial model touches 2013-04-11 14:54:25 +01:00			`# m.plot_latent(labels=data['Y'].argmax(axis=1))`
			`return m`

			`def mrd_simulation():`
kern plotting with axisa 2013-04-11 15:47:18 +01:00			`# num = 2`
first trivial model touches 2013-04-11 14:54:25 +01:00			`ard1 = np.array([1., 1, 0, 0], dtype=float)`
			`ard2 = np.array([0., 1, 1, 0], dtype=float)`
kern plotting with axisa 2013-04-11 15:47:18 +01:00			`ard1[ard1 == 0] = 1E-10`
			`ard2[ard2 == 0] = 1E-10`
first trivial model touches 2013-04-11 14:54:25 +01:00
kern plotting with axisa 2013-04-11 15:47:18 +01:00			`ard1i = 1. / ard1`
			`ard2i = 1. / ard2`

			`# make_params = lambda ard: np.hstack([[1], ard, [1, .3]])`
first trivial model touches 2013-04-11 14:54:25 +01:00
			`D1, D2, N, M, Q = 50, 100, 150, 15, 4`
			`X = np.random.randn(N, Q)`

kern plotting with axisa 2013-04-11 15:47:18 +01:00			`k = GPy.kern.rbf(Q, ARD=True, lengthscale=ard1i) + GPy.kern.bias(Q, 0) + GPy.kern.white(Q, 0.0001)`
first trivial model touches 2013-04-11 14:54:25 +01:00			`Y1 = np.random.multivariate_normal(np.zeros(N), k.K(X), D1).T`
			`Y1 -= Y1.mean(0)`

kern plotting with axisa 2013-04-11 15:47:18 +01:00			`k = GPy.kern.rbf(Q, ARD=True, lengthscale=ard2i) + GPy.kern.bias(Q, 0) + GPy.kern.white(Q, 0.0001)`
first trivial model touches 2013-04-11 14:54:25 +01:00			`Y2 = np.random.multivariate_normal(np.zeros(N), k.K(X), D2).T`
			`Y2 -= Y2.mean(0)`

			`k = GPy.kern.rbf(Q, ARD=True) + GPy.kern.bias(Q) + GPy.kern.white(Q, 1.0)`

			`m = MRD(Y1, Y2, Q=Q, M=M, kernel=k, _debug=False)`
			`m.ensure_default_constraints()`

kern plotting with axisa 2013-04-11 15:47:18 +01:00			`fig = pyplot.figure("expected", figsize=(8, 3))`
			`ax = fig.add_subplot(121)`
			`ax.bar(np.arange(ard1.size) + .1, ard1)`
			`ax = fig.add_subplot(122)`
			`ax.bar(np.arange(ard2.size) + .1, ard2)`
first trivial model touches 2013-04-11 14:54:25 +01:00
Further edits on visualization code for faces example. 2013-04-02 02:20:53 +02:00			`return m`

			`def brendan_faces():`
			`data = GPy.util.datasets.brendan_faces()`
Minor modifications to visualization routines and examples. 2013-04-02 10:49:09 +02:00			`Y = data['Y'][0:-1:10, :]`
			`m = GPy.models.GPLVM(data['Y'], 2)`
Further edits on visualization code for faces example. 2013-04-02 02:20:53 +02:00
			`# optimize`
			`m.ensure_default_constraints()`
Minor modifications to visualization routines and examples. 2013-04-02 10:49:09 +02:00			`m.optimize(messages=1, max_f_eval=10000)`
Further edits on visualization code for faces example. 2013-04-02 02:20:53 +02:00
			`ax = m.plot_latent()`
first trivial model touches 2013-04-11 14:54:25 +01:00			`y = m.likelihood.Y[0, :]`
Further edits on visualization code for faces example. 2013-04-02 02:20:53 +02:00			`data_show = GPy.util.visualize.image_show(y[None, :], dimensions=(20, 28), transpose=True, invert=False, scale=False)`
			`lvm_visualizer = GPy.util.visualize.lvm(m, data_show, ax)`
			`raw_input('Press enter to finish')`
			`plt.close('all')`

			`return m`

			`def stick():`
			`data = GPy.util.datasets.stick()`
Minor modifications to visualization routines and examples. 2013-04-02 10:49:09 +02:00			`m = GPy.models.GPLVM(data['Y'], 2)`
first trivial model touches 2013-04-11 14:54:25 +01:00
Further edits on visualization code for faces example. 2013-04-02 02:20:53 +02:00			`# optimize`
			`m.ensure_default_constraints()`
			`m.optimize(messages=1, max_f_eval=10000)`

			`ax = m.plot_latent()`
first trivial model touches 2013-04-11 14:54:25 +01:00			`y = m.likelihood.Y[0, :]`
Further edits on visualization code for faces example. 2013-04-02 02:20:53 +02:00			`data_show = GPy.util.visualize.stick_show(y[None, :], connect=data['connect'])`
			`lvm_visualizer = GPy.util.visualize.lvm(m, data_show, ax)`
			`raw_input('Press enter to finish')`
			`plt.close('all')`

			`return m`
added BGPLVM oil flow demo and changed default X_variance init 2013-03-21 15:28:46 +00:00

			`def BGPLVM_oil():`
			`data = GPy.util.datasets.oil()`
			`Y, X = data['Y'], data['X']`
			`X -= X.mean(axis=0)`
made BGPLVM oil flow demo work, added ARD weights plot 2013-03-22 15:58:02 +00:00			`X /= X.std(axis=0)`
added BGPLVM oil flow demo and changed default X_variance init 2013-03-21 15:28:46 +00:00
			`Q = 10`
			`M = 30`

kern plotting with axisa 2013-04-11 15:47:18 +01:00			`kernel = GPy.kern.rbf(Q, ARD=True) + GPy.kern.bias(Q) + GPy.kern.white(Q)`
added BGPLVM oil flow demo and changed default X_variance init 2013-03-21 15:28:46 +00:00			`m = GPy.models.Bayesian_GPLVM(X, Q, kernel=kernel, M=M)`
made BGPLVM oil flow demo work, added ARD weights plot 2013-03-22 15:58:02 +00:00			`# m.scale_factor = 100.0`
added BGPLVM oil flow demo and changed default X_variance init 2013-03-21 15:28:46 +00:00			`m.constrain_positive('(white\|noise\|bias\|X_variance\|rbf_variance\|rbf_length)')`
			`from sklearn import cluster`
			`km = cluster.KMeans(M, verbose=10)`
			`Z = km.fit(m.X).cluster_centers_`
			`# Z = GPy.util.misc.kmm_init(m.X, M)`
			`m.set('iip', Z)`
made BGPLVM oil flow demo work, added ARD weights plot 2013-03-22 15:58:02 +00:00			`m.set('bias', 1e-4)`
added BGPLVM oil flow demo and changed default X_variance init 2013-03-21 15:28:46 +00:00			`# optimize`
			`# m.ensure_default_constraints()`

			`import pdb; pdb.set_trace()`
			`m.optimize('tnc', messages=1)`
			`print m`
			`m.plot_latent(labels=data['Y'].argmax(axis=1))`
			`return m`