如何在SAS中使用Datalines语句来创建一个数据集

1,253 阅读1分钟

你可以使用SAS中的datalines语句来快速地从头创建一个新的数据集。

你可以使用下面的基本语法来做:

data original_data;
    input var1 $ var2;
    datalines;
A 12
B 19
C 23
D 40
;
run;

下面是每个语句的作用:

  • data:数据集的名称
  • 输入:数据集中每个变量的名称和类型
  • datalines。数据集中的实际值

注意,变量名称后面的美元符号"$"告诉SAS,该变量是一个字符变量。

下面的例子展示了如何在实践中使用datalines语句。

例1:用所有数字变量创建数据集

下面的代码显示了如何用三个数字变量创建一个数据集:得分、助攻和篮板:

/*create dataset*/
data original_data;
    input points assists rebounds;
    datalines;
22 8 4
29 5 4
31 12 8
30 9 14
22 7 1
24 9 2
18 6 4
20 5 5
25 1 4
;
run;

/*view dataset*/
proc print data=original_data;

其结果是一个包含三个数字变量的数据集。

例2: 用字符和数字变量创建数据集

下面的代码展示了如何创建一个包含字符和数字变量的数据集:

/*create dataset*/
data original_data;
    input team $ position $ points assists;
    datalines;
A Guard 8 4
A Guard 5 4
A Forward 12 8
A Forward 9 14
A Forward 7 1
B Guard 9 2
B Guard 14 9
B Forward 15 8
B Forward 11 4
;
run;

/*view dataset*/
proc print data=original_data;

我们可以使用proc contents函数来检查每个变量的类型:

proc contents data=original_data;

从输出结果中我们可以看到,球队位置是字符变量,而得分助攻是数字变量。

其他资源

下面的教程解释了如何在SAS中执行其他常见任务:

如何在SAS中创建新的变量
如何在SAS中替换字符串中的字符
如何在SAS中用零替换缺失的值
如何在SAS中删除重复的内容