推荐系统 | One-Hot编码

1,318 阅读2分钟

1、定义

One-Hot编码,又称为一位有效编码,主要是采用N位状态寄存器来对N个状态进行编码,每个状态都由他独立的寄存器位,并且在任意时候只有一位有效


2、例子

2.1五个样品,三个特征


特征一特征二特征三
物品一111
物品二222
物品三313
物品四422
物品五411

2.2特征可能取值

特征特征一特征二特征三
情况四种两种三种


2.3编码

以特征三为例,其有三种取值,用3个状态位来表示,以保证每个样本中的每个特征只有1位处于状态1,其他都是0

状态编码

1

001
2010
3100

2.4最终表示


特征一特征二特征三
物品一[0001][01][001]
物品二[0010][10][010]
物品三[0100][01][100]
物品四[1000][10][010]
物品五[1000][01][001]


样本特征向量
物品一[000101001]
物品二[001010010]
物品三[010001100]
物品四[100010010]
物品五[100001001]

3、应用

3.1物品特征表

商品颜色尺寸内存价格
Iphone 5金色416G1358元
Iphone 6银色4.732G2788元
Iphone 6 plus白色5.564G3656元


3.2描述

  • 颜色特征值包括:[金色,银色,白色]
  • 内存特征值包括:[16G,32G,64G]
商品颜色内存
Iphone 5[1,0,0][1,0,0]
Iphone 6[0,1,0][0,1,0]
Iphone 6 plus[0,0,1][0,0,1]
商品特征向量
Iphone 5[1,0,0,1,0,0]
Iphone 6[0,1,0,0,1,0]
Iphone 6 plus[0,0,1,0,0,1]