跟李沐学AI随记-1-基础知识

126 阅读1分钟

深度学习基础框架

image.png

1. 数据操作

(1)元素访问

image.png -----回顾一下基础的访问方法,特别是针对二维数组的情况。(一列这里应该是[:,1],ppt打错了)

针对子区域模式,注意是开区间(1:3指【1,3),1:指从第一列往后的所有数据) ::指跳跃方式访问,::n-->每n位跳一次访问

torch中以张量形式储存数据--结合数组维度

构建张量后,加减乘除运算都是对应元素进行的

torch.cat--dim=0表示行拼接,列数不变,dim=1表示列拼接,行数不变

image.png

对张量中所有元素求和--X.sum,求和后产生只有一个元素的张量

注意:广播机制可以实现形状不同的张量进行按元素操作 ---维度的增加,所以要注意元素维度

image.png

python中的内存操作---针对大数组时才考虑

---- id()类似于C++中指针的作用

image.png

2.数据预处理

构建csv文件
利用os库和pandas库进行数据的读写,注意如何处理缺失的数据(.fillna),典型方法包括插值和删除

对于类别值或者离散值,可以将NaN视作一个类别

image.png

构建数值类型后可转化为张量格式

整体流程:读入CSV文件,处理缺失值,再对类别/离散值进行类别划分,全部转化为数值类型的。