Unsupervised Metric Learning 和 Preprocessor

97 阅读1分钟

Unsupervised Metric Learning

无监督度量学习算法只将一个(未标记的)数据集 xx 作为输入。目前,只有协方差算法( Covariance),这是一个简单的基线算法(见下文)。

算法

协方差

协方差“不学习”任何东西,而是计算输入数据的协方差矩阵,这是一种基线算法。可用于 ZCA 数据的白化处理:

image.png

Preprocessor

在度量学习中的估计器在实例化时都有一个preprocessor选项。填充这个参数允许他们在拟合、预测等时采用更紧凑的输入表示。

preprocessor=None,不使用预处理器,用户必须为 fit/predict/score/等提供典型的表示方式。

Array-like

可以指定 preprocessor=x,此处x为一个array-like的数据基样本点。一个有监督的度量学习期的例子:

image.png

一个弱监督学习器的例子:

image.png

Callable

此外,可以提供一个可调用 preprocessor,estimator接收的是数据点的指示器而不是样本点本身。

image.png

注意:当填写 preprocessor 选项时,它允许更紧凑的输入,但传统的输入方式仍然有效(2D array-like对于监督学习器,3D array-like 元组对于弱监督学习器)。如果提供了经典的输入,度量学习器将不会使用预处理器。

关于此的样例: image.png