R语言学习四

70 阅读1分钟

基本数据管理

直接上小示例:
这里写图片描述
以上是实现数据sumx和meanx整合到原始mydata数据框中的两种实现方式,建议用第二个
还有一个问题,就是重编码,也就是给已有的数据赋予新值,比如有个999岁的人,此处记录是错误的,要将其设置为缺失值,可以使用如下代码:
leadership age[leadership age==99] <-NA
其中:variable[condition]<-expression当且仅当condition的值为TRUE时进行赋值
这里写图片描述
改变变量的名称:
这里写图片描述
或者直接调用fix(leadership),会直接出来一个对话框,可以鼠标进行修改
这里写图片描述
如果使用reshape也可以直接使用names,names(leadership)[2]<-“testDate”
结果如下:
这里写图片描述
这里写图片描述
NA:not available,不可用
NAN:Not a Number,非数值
这里写图片描述
对于缺失值,可以忽略掉,不然容易影响结果:
这里写图片描述
然后,也可以使用na.omit()来删掉不完整的观测:
这里写图片描述
这里写图片描述
数据类型转换:
直接列举函数:
这里写图片描述
数据排序:
这里写图片描述
还有一类,就是用sql进行数据查询和处理,这部分应用比较简单,这里不讲了,网上可以搜到。