你可以使用SAS中的datalines语句来快速地从头创建一个新的数据集。
你可以使用下面的基本语法来做:
data original_data;
input var1 $ var2;
datalines;
A 12
B 19
C 23
D 40
;
run;
下面是每个语句的作用:
- data:数据集的名称
- 输入:数据集中每个变量的名称和类型
- datalines。数据集中的实际值
注意,变量名称后面的美元符号"$"告诉SAS,该变量是一个字符变量。
下面的例子展示了如何在实践中使用datalines语句。
例1:用所有数字变量创建数据集
下面的代码显示了如何用三个数字变量创建一个数据集:得分、助攻和篮板:
/*create dataset*/
data original_data;
input points assists rebounds;
datalines;
22 8 4
29 5 4
31 12 8
30 9 14
22 7 1
24 9 2
18 6 4
20 5 5
25 1 4
;
run;
/*view dataset*/
proc print data=original_data;
其结果是一个包含三个数字变量的数据集。
例2: 用字符和数字变量创建数据集
下面的代码展示了如何创建一个包含字符和数字变量的数据集:
/*create dataset*/
data original_data;
input team $ position $ points assists;
datalines;
A Guard 8 4
A Guard 5 4
A Forward 12 8
A Forward 9 14
A Forward 7 1
B Guard 9 2
B Guard 14 9
B Forward 15 8
B Forward 11 4
;
run;
/*view dataset*/
proc print data=original_data;
我们可以使用proc contents函数来检查每个变量的类型:
proc contents data=original_data;
从输出结果中我们可以看到,球队和位置是字符变量,而得分和助攻是数字变量。
其他资源
下面的教程解释了如何在SAS中执行其他常见任务:
如何在SAS中创建新的变量
如何在SAS中替换字符串中的字符
如何在SAS中用零替换缺失的值
如何在SAS中删除重复的内容