首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
木白端墨
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
104
文章 104
沸点 0
赞
104
返回
|
搜索文章
最新
热门
项目实战:电影数据分析
通过上面的结果信息可以知道:整个数据集缺失的数据比较少。 其中 release_date(首次上映日期)缺失 1 个数据,可以通过网上查询补齐这个数据,填补 release_date(首次上映日期)数据
pip换源
一、pip国内的一些镜像修改源方法:临时使用:可以在使用pip的时候在后面加上-i参数,指定pip源二、永久修改pip源**linux:**修改~/.pip/pip.conf(没有就创建一个),内容如
Pyecharts 可视化
Echarts 是百度开源的一个数据可视化 JS 库,主要用于数据可视化,Pyecharts 是一 个用于生成 Echarts 图表的类库。实际上就是 Echarts 与 Python 的对接
利用 Pandas 进行数据处理
3σ原则又称为拉依达法则。该法则就是先假设一组检测数据只含有随机误差,对原始 数据进行计算处理得到标准差,然后按一定的概率确定一个区间,认为误差超过这个区间的就属于异常值 (4)同时,还可以看出离差标准化的缺点:若数据集中某个数值很大,则离差标准化 的值就会接近于 0,并且相互…
利用 Pandas 进行数据处理
不一致的:在编码或者命名上存在差异,E.g. Age=“42” Birthday=“03/07/1997” 如:等级代码 前面“1,2,3”, 后面“A, B, C” append 方法也可以用于纵向合并两张表。但是 append 方法实现纵向表堆叠有一个前提 条件,那就是两张…
Pandas进阶
该方法提供的是分组聚合步骤中的拆分功能,能根据索引或字段对数据进行分组。其常 用参数与使用格式如下 3、可以使用 agg 方法一次对 DataFrame 的不同的列,求取不同个数的统计指标。 在某些时候还希望求出某个字段的多个统计量,某些字段则只需要求一个统计量,此时 只需要将…
Pandas 基础
(2)如果保存的时候指定 sheetnames 参数,会发现,每保存一次,会覆盖一次保存的 内容,即只会保留最后一次保存的内容。如果想要将不同的 dataframe 保存到同一个 excel 的不同 sheet 中去可以: loc 方法是针对 DataFrame 索引名称的切片…
Matplotlib库简介
而观察数据的分布散点,可以得到:该数据的分布规律并不相同。那么根据指标所得到 的规律只是显示着该数据的某些指标相同,但是真实的规律还得需要图形的支撑,不然不足 以提供强大的说服力 第一部分主要作用是构建出一张空白的画布,并可以选择是否将整个画布划分为多个部 分,方便在同一幅图上…
Numpy矩阵
sort 函数是最常用的排序方法。 arr.sort() argsort 函数返回值为重新排序值的下标。 arr.argsort()
Numpy数组
Numpy 是用于数据科学计算的基础,不但能够完成科学计算任务,还能被用作高效地多 维数据容器。用于存储和处理大型矩阵
下一页
个人成就
文章被点赞
92
文章被阅读
55,844
掘力值
1,129
关注了
0
关注者
5
收藏集
1
关注标签
13
加入于
2019-12-15