pandas包安装教程

303 阅读2分钟

开启掘金成长之旅!这是我参与「掘金日新计划 · 12 月更文挑战」的第10天

本文首发于CSDN。

诸神缄默不语-个人CSDN博文目录

pandas是数据科学中常用的Python包。本文介绍其安装教程。 pandas官网:pandas - Python Data Analysis Library pandas文档官网:pandas documentation — pandas 1.4.2 documentation 如果使用anaconda作为Python虚拟环境管理工具,则其base环境中会直接默认安装pandas包,这也是pandas官网getting started页面中介绍的方法:pandas - Python Data Analysis Library anaconda的安装和使用此处不再赘述。

如果不是anaconda的base环境,则可以参考pandas文档中安装部分的介绍来进行安装:Installation — pandas 1.4.2 documentation pandas官方支持Python3.8, 3.9和3.10版本。 直接在虚拟环境中用conda安装即可:conda install pandas

pandas包是常用的数据分析包,经典用处就是对表格(往往被定义为pandas.DataFrame对象)数据进行处理,应该可以被说成是高级版Excel。可以画图、批量处理各行数据。 pandas表格可以直接打印出来,效果还是挺好看的。 pandas包据说是参考MATLAB实现的。嘛我以前用过MATLAB,现在基本上不用了,反正MATLAB比较典型的特征就是从1开始,典型的数学工具(计算机工具一般都从0开始嘛)。 pandas包和numpy包关联很深,应该就是基于numpy包之上进行开发的,很多格式都可以互相转换。 数据科学其他常用的包还有matplotlib和seaborn,是画图包。其中matplotlib难用一些,seaborn是对matplotlib做了封装,代码更简单,画的图也要更精美一些。 单做数据分析的话,为了可视化好看,其实用Jupyter Notebook的情况挺多的。但为了做项目,最好还是用正经IDE。