pybrain有自己的数据集格式,包含数据和标签,pybrain.dataset包里含有各种数据格式,对于监督学习SupervisedDataSet是其数据集格式
>>> from pybrain.datasets import SupervisedDataSet
>>> ds = SupervisedDataSet(2, 1)
在初始化时需要指定其大小,2表示输入数据是2维的,1表示标签是1维的。
通过addSample方法可以向数据集添加数据
>>> ds.addSample((0, 0), (0,))
>>> ds.addSample((0, 1), (1,))
>>> ds.addSample((1, 0), (1,))
>>> ds.addSample((1, 1), (0,))
第一个参数是数据,第二个参数是对应的标签
>>> len(ds)
4
>>> for inpt, target in ds:
... print inpt, target
...
[ 0. 0.] [ 0.]
[ 0. 1.] [ 1.]
[ 1. 0.] [ 1.]
[ 1. 1.] [ 0.]
>>> ds['input']
array([[ 0., 0.],
[ 0., 1.],
[ 1., 0.],
[ 1., 1.]])
>>> ds['target']
array([[ 0.],
[ 1.],
[ 1.],
[ 0.]])
通过clear方法可以清除所有数据
>>> ds.clear()
>>> ds['input']
array([], shape=(0, 2), dtype=float64)
>>> ds['target']
array([], shape=(0, 1), dtype=float64)
\