什么是变量
在统计学研究中,变量是对象的特征。
变量可以是定性的,也可以是定量的。
定性的变量是类别变量,比如血型,学历,付款方式,性别等
定性的变量分为2种,连续变量和离散变量。
社会科学中研究变量的关系,通常把一个变量称为自变量(独立变量),另一个变量称之为因变量(依赖变量)。
连续变量和离散变量
在统计学研究中,变量按变量值是否连续可分为连续变量与离散变量两种。
在一定区间内,连续变量不能一一列举其变量值,
在一定区间内,离散变量可以列举出所有的变量值。
在一定区间内可以任意取值的变量叫连续变量,其数值是连续不断的,相邻两个数值之间可作无限分割。
例如,生产零件的规格尺寸,人体测量的身高、体重、胸围等为连续变量,其数值只能用测量或计量的方法取得。
反之,其变量值只能用自然数或整数单位计算的则为离散变量。
例如,企业个数,职工人数,设备台数等,只能按计量单位数计数,这种变量的数值一般用计数方法取得。
类别变量
类别变量包含有限的类别数或可区分组数。
类有限的类别数,例如,性别,天气情况,血型,付款方式。
可区分组数,例如[0,100],[100,500],[500,1000]
总结
连续变量:变量值是数不清的,不能意义列举出来。
离散变量和类别变量都是可以枚举出来的。
如果一个字段是类别变量,那么这个字段的数据类型肯定是字符串。
如果一个字段是连续变量,那么这个字段的数据类型肯定是float型,因为任意2个数值之间可以无限划分。
如果一个字段是离散变量,那么这个字段的数据类型可能是int,也可能是float。