首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
数据清洗
订阅
花椒要麻
更多收藏集
微信扫码分享
微信
新浪微博
QQ
6篇文章 · 0订阅
3. 清洗常用4板斧
这是Python数据分析实战基础的第三篇内容,主要对前两篇进行补充,把实际数据清洗场景下常用但零散的方法,按增、删、查、分四板斧的逻辑进行归类,以减少记忆成本,提升学习和使用效率。 上述三个级别数据在同一个excel中不同Sheet中。 首先,导入案例数据集。因为案例数据存放在…
还在抱怨pandas运行速度慢?这几个方法会颠覆你的看法
当大家谈到数据分析时,提及最多的语言就是Python和SQL。Python之所以适合数据分析,是因为它有很多第三方强大的库来协助,pandas就是其中之一。pandas的文档中是这样描述的: 我们知道pandas的两个主要数据结构:dataframe和series,我们对数据的…
别找了,这是 Pandas 最详细教程了
Python 是开源的,它很棒,但是也无法避免开源的一些固有问题:很多包都在做(或者在尝试做)同样的事情。如果你是 Python 新手,那么你很难知道某个特定任务的最佳包是哪个,你需要有经验的人告诉你。有一个用于数据科学的包绝对是必需的,它就是 pandas。 pandas 最…
Pandas数据分析——Merge数据拼接图文详解
为了方便维护,一般公司的数据在数据库内都是分表存储的,比如用一个表存储所有用户的基本信息,一个表存储用户的消费情况。所以,在日常的数据处理中,经常需要将两张表拼接起来使用,这样的操作对应到SQL中是join,在Pandas中则是用merge来实现。这篇文章就讲一下merge的主…
数据分析入门系列教程-数据清洗
首先先来进行一个数据清洗的实战,使用比较经典的数据集,泰坦尼克号生存预测数据。 这里得到的各项指标,我们先保存不动,在后面处理缺失值时会有用到。 从图中我们可以看出,整体数据时向左偏的,即大多数数据是小于平均值的,故而我们可以采用中位数来填补空值,而不是平均数。 从上面的 de…
使用Pandas&NumPy进行数据清洗的6大常用方法
数据分析师常用的6大数据清洗方法。