GPy/benchmarks/regression/methods.py

# Copyright (c) 2015, Zhenwen Dai
# Licensed under the BSD 3-clause license (see LICENSE.txt)

import abc
import numpy as np
import GPy

class RegressionMethod(object):
    __metaclass__ = abc.ABCMeta
    
    def __init__(self):
        self.preprocess = True
        
    def _preprocess(self, data,  train):
        """Zero-mean, unit-variance normalization by default"""
        if train:
            inputs, labels = data
            self.data_mean = inputs.mean(axis=0)
            self.data_std = inputs.std(axis=0)
            self.labels_mean = labels.mean(axis=0)
            self.labels_std = labels.std(axis=0)
            return ((inputs-self.data_mean)/self.data_std, (labels-self.labels_mean)/self.labels_std)
        else:
            return (data-self.data_mean)/self.data_std
    
    def _reverse_trans_labels(self, labels):
        return labels*self.labels_std+self.labels_mean
        
    def fit(self, train_data):
        if self.preprocess:
            train_data = self._preprocess(train_data, True)
        return self._fit(train_data)
    
    def predict(self, test_data):
        if self.preprocess:
            test_data = self._preprocess(test_data, False)
        labels = self._predict(test_data)
        if self.preprocess:
            labels = self._reverse_trans_labels(labels)
        return labels
    
    @abc.abstractmethod
    def _fit(self, train_data):
        """Fit the model. Return True if successful"""
        return True
    
    @abc.abstractmethod
    def _predict(self, test_data):
        """Predict on test data"""
        return None
    
class GP_RBF(RegressionMethod):
    name = 'GP_RBF'
    
    def _fit(self, train_data):
        inputs, labels = train_data
        self.model = GPy.models.GPRegression(inputs, labels,kernel=GPy.kern.RBF(inputs.shape[-1],ARD=True) +GPy.kern.Linear(inputs.shape[1], ARD=True)   )
        self.model.likelihood.variance[:] = labels.var()*0.01
        self.model.optimize()
        return True
    
    def _predict(self, test_data):
        return self.model.predict(test_data)[0]
    
class SparseGP_RBF(RegressionMethod):
    name = 'SparseGP_RBF'
    
    def _fit(self, train_data):
        inputs, labels = train_data
        self.model = GPy.models.SparseGPRegression(inputs, labels,kernel=GPy.kern.RBF(inputs.shape[-1],ARD=True) +GPy.kern.Linear(inputs.shape[1], ARD=True) ,num_inducing=100)
        self.model.likelihood.variance[:] = labels.var()*0.01
        self.model.optimize()
        return True
    
    def _predict(self, test_data):
        return self.model.predict(test_data)[0]
    
# class MRD_RBF(RegressionMethod):
#     name = 'MRD_RBF'
#     
#     def _fit(self, train_data):
#         inputs, labels = train_data
#         Q = 5
#         self.model = GPy.models.MRD([inputs, labels],Q,kernel=GPy.kern.RBF(Q,ARD=True),num_inducing=50)
#         self.model.Y0.likelihood.variance[:] = inputs.var()*0.01
#         self.model.Y1.likelihood.variance[:] = labels.var()*0.01
#         self.model.optimize()
#         return True
#     
#     def _predict(self, test_data):
#         return self.model.predict(self.model.Y0.infer_newX(test_data)[0])[0]

class SVIGP_RBF(RegressionMethod):
    name = 'SVIGP_RBF'
    
    def _fit(self, train_data):
        X, Y = train_data
        
        Z = X[np.random.permutation(X.shape[0])[:100]]
        k = GPy.kern.RBF(X.shape[1], ARD=True) + GPy.kern.Linear(X.shape[1], ARD=True) + GPy.kern.White(X.shape[1],0.01) 

        lik = GPy.likelihoods.StudentT(deg_free=3.)
        self.model = GPy.core.SVGP(X, Y, Z=Z, kernel=k, likelihood=lik)
        [self.model.optimize('scg', max_iters=40, gtol=0, messages=0, xtol=0, ftol=0) for i in range(10)]
        self.model.optimize('bfgs', max_iters=1000, gtol=0, messages=0)
        return True
    
    def _predict(self, test_data):
        return self.model.predict(test_data)[0]
add the regression benchmark 2015-08-27 17:04:52 +01:00			`# Copyright (c) 2015, Zhenwen Dai`
			`# Licensed under the BSD 3-clause license (see LICENSE.txt)`

			`import abc`
			`import numpy as np`
			`import GPy`

			`class RegressionMethod(object):`
			`__metaclass__ = abc.ABCMeta`

			`def __init__(self):`
			`self.preprocess = True`

			`def _preprocess(self, data, train):`
			`"""Zero-mean, unit-variance normalization by default"""`
			`if train:`
			`inputs, labels = data`
			`self.data_mean = inputs.mean(axis=0)`
			`self.data_std = inputs.std(axis=0)`
			`self.labels_mean = labels.mean(axis=0)`
			`self.labels_std = labels.std(axis=0)`
			`return ((inputs-self.data_mean)/self.data_std, (labels-self.labels_mean)/self.labels_std)`
			`else:`
			`return (data-self.data_mean)/self.data_std`

			`def _reverse_trans_labels(self, labels):`
			`return labels*self.labels_std+self.labels_mean`

			`def fit(self, train_data):`
			`if self.preprocess:`
			`train_data = self._preprocess(train_data, True)`
			`return self._fit(train_data)`

			`def predict(self, test_data):`
			`if self.preprocess:`
			`test_data = self._preprocess(test_data, False)`
			`labels = self._predict(test_data)`
			`if self.preprocess:`
			`labels = self._reverse_trans_labels(labels)`
			`return labels`

			`@abc.abstractmethod`
			`def _fit(self, train_data):`
			`"""Fit the model. Return True if successful"""`
			`return True`

			`@abc.abstractmethod`
			`def _predict(self, test_data):`
			`"""Predict on test data"""`
			`return None`

			`class GP_RBF(RegressionMethod):`
			`name = 'GP_RBF'`

			`def _fit(self, train_data):`
			`inputs, labels = train_data`
add MRD for regression benchmark 2015-08-27 17:38:45 +01:00			`self.model = GPy.models.GPRegression(inputs, labels,kernel=GPy.kern.RBF(inputs.shape[-1],ARD=True) +GPy.kern.Linear(inputs.shape[1], ARD=True) )`
add the regression benchmark 2015-08-27 17:04:52 +01:00			`self.model.likelihood.variance[:] = labels.var()*0.01`
			`self.model.optimize()`
			`return True`

			`def _predict(self, test_data):`
			`return self.model.predict(test_data)[0]`
add MRD for regression benchmark 2015-08-27 17:38:45 +01:00
			`class SparseGP_RBF(RegressionMethod):`
			`name = 'SparseGP_RBF'`

			`def _fit(self, train_data):`
			`inputs, labels = train_data`
			`self.model = GPy.models.SparseGPRegression(inputs, labels,kernel=GPy.kern.RBF(inputs.shape[-1],ARD=True) +GPy.kern.Linear(inputs.shape[1], ARD=True) ,num_inducing=100)`
			`self.model.likelihood.variance[:] = labels.var()*0.01`
			`self.model.optimize()`
			`return True`

			`def _predict(self, test_data):`
			`return self.model.predict(test_data)[0]`

			`# class MRD_RBF(RegressionMethod):`
			`# name = 'MRD_RBF'`
			`#`
			`# def _fit(self, train_data):`
			`# inputs, labels = train_data`
			`# Q = 5`
			`# self.model = GPy.models.MRD([inputs, labels],Q,kernel=GPy.kern.RBF(Q,ARD=True),num_inducing=50)`
			`# self.model.Y0.likelihood.variance[:] = inputs.var()*0.01`
			`# self.model.Y1.likelihood.variance[:] = labels.var()*0.01`
			`# self.model.optimize()`
			`# return True`
			`#`
			`# def _predict(self, test_data):`
			`# return self.model.predict(self.model.Y0.infer_newX(test_data)[0])[0]`
add the regression benchmark 2015-08-27 17:04:52 +01:00
			`class SVIGP_RBF(RegressionMethod):`
			`name = 'SVIGP_RBF'`

			`def _fit(self, train_data):`
			`X, Y = train_data`

			`Z = X[np.random.permutation(X.shape[0])[:100]]`
			`k = GPy.kern.RBF(X.shape[1], ARD=True) + GPy.kern.Linear(X.shape[1], ARD=True) + GPy.kern.White(X.shape[1],0.01)`

			`lik = GPy.likelihoods.StudentT(deg_free=3.)`
			`self.model = GPy.core.SVGP(X, Y, Z=Z, kernel=k, likelihood=lik)`
			`[self.model.optimize('scg', max_iters=40, gtol=0, messages=0, xtol=0, ftol=0) for i in range(10)]`
			`self.model.optimize('bfgs', max_iters=1000, gtol=0, messages=0)`
			`return True`

			`def _predict(self, test_data):`
			`return self.model.predict(test_data)[0]`