pybrain学习教程(二):创建数据集

108 阅读1分钟

pybrain有自己的数据集格式,包含数据和标签,pybrain.dataset包里含有各种数据格式,对于监督学习SupervisedDataSet是其数据集格式

>>> from pybrain.datasets import SupervisedDataSet
>>> ds = SupervisedDataSet(2, 1)

在初始化时需要指定其大小,2表示输入数据是2维的,1表示标签是1维的。

通过addSample方法可以向数据集添加数据

>>> ds.addSample((0, 0), (0,))
>>> ds.addSample((0, 1), (1,))
>>> ds.addSample((1, 0), (1,))
>>> ds.addSample((1, 1), (0,))

第一个参数是数据,第二个参数是对应的标签

>>> len(ds)
4
>>> for inpt, target in ds:
...   print inpt, target
...
[ 0.  0.] [ 0.]
[ 0.  1.] [ 1.]
[ 1.  0.] [ 1.]
[ 1.  1.] [ 0.]
>>> ds['input']
array([[ 0.,  0.],
       [ 0.,  1.],
       [ 1.,  0.],
       [ 1.,  1.]])
>>> ds['target']
array([[ 0.],
       [ 1.],
       [ 1.],
       [ 0.]])

通过clear方法可以清除所有数据

>>> ds.clear()
>>> ds['input']
array([], shape=(0, 2), dtype=float64)
>>> ds['target']
array([], shape=(0, 1), dtype=float64)

\