深度学习基础框架
1. 数据操作
(1)元素访问
-----回顾一下基础的访问方法,特别是针对二维数组的情况。(一列这里应该是[:,1],ppt打错了)
针对子区域模式,注意是开区间(1:3指【1,3),1:指从第一列往后的所有数据) ::指跳跃方式访问,::n-->每n位跳一次访问
torch中以张量形式储存数据--结合数组维度
构建张量后,加减乘除运算都是对应元素进行的
torch.cat--dim=0表示行拼接,列数不变,dim=1表示列拼接,行数不变
对张量中所有元素求和--X.sum,求和后产生只有一个元素的张量
注意:广播机制可以实现形状不同的张量进行按元素操作 ---维度的增加,所以要注意元素维度
python中的内存操作---针对大数组时才考虑
---- id()类似于C++中指针的作用
2.数据预处理
构建csv文件
利用os库和pandas库进行数据的读写,注意如何处理缺失的数据(.fillna),典型方法包括插值和删除
对于类别值或者离散值,可以将NaN视作一个类别
构建数值类型后可转化为张量格式
整体流程:读入CSV文件,处理缺失值,再对类别/离散值进行类别划分,全部转化为数值类型的。