首页
首页
沸点
课程
直播
活动
竞赛
商城
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
Python数据科学
掘友等级
风控建模
|
银行
数据爱好者
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
赞
58
文章 57
沸点 1
赞
58
返回
|
搜索文章
文章
热门
最新
安利一个Python大数据分析神器!
对于Pandas运行速度的提升方法,之前已经介绍过很多回了,里面经常提及Dask,很多朋友没接触过可能不太了解,今天就推荐一下这个神器。 Pandas和Numpy大家都不陌生了,代码运行后数据都加载到RAM中,如果数据集特别大,我们就会看到内存飙升。但有时要处理的数据并不适合R…
再见,可视化!你好,Pandas!
用Python做数据分析离不开pandas,pnadas更多的承载着处理和变换数据的角色,pands中也内置了可视化的操作,但效果很糙。 因此,大家在用Python做数据分析时,正常的做法是用先pandas先进行数据处理,然后再用Matplotlib、Seaborn、Plotl…
安利 5 个拍案叫绝的 Matplotlib 骚操作!
大家都知道,Matplotlib是Python的可视化库,功能很强,可以绘制各种图。一些常规用法前不久分享过Matplotlib官方出品的cheatsheet:Matplotlib官方小抄手册公开,配套可视化代码已打包! 但是!今天我们不走寻常路,专挑几个贼骚的操作分享下. 1…
爱了!安利一个相见恨晚的可视化学习网站
最近日常逛逛技术平台,偶然间发现了一个非常牛逼的可视化学习网站。东哥之前在公众号和技术群里也推荐过一些,但和这个相比我觉得真是太逊色了。 好了,话不多说,我迫不及待地想分享下这个神器。 这个网站的名字叫 图之典,它是由一群数据可视化爱好者共同建立起来的,这些人来自各大公司,利用…
Python一行代码搞定炫酷可视化,你需要了解一下Cufflinks
学过Python数据分析的朋友都知道,在可视化的工具中,有很多优秀的三方库,比如matplotlib,seaborn,plotly,Boken,pyecharts等等。这些可视化库都有自己的特点,在实际应用中也广为大家使用。 plotly、Boken等都是交互式的可视化工具,结…
还在抱怨pandas运行速度慢?这几个方法会颠覆你的看法
当大家谈到数据分析时,提及最多的语言就是Python和SQL。Python之所以适合数据分析,是因为它有很多第三方强大的库来协助,pandas就是其中之一。pandas的文档中是这样描述的: 我们知道pandas的两个主要数据结构:dataframe和series,我们对数据的…
99%的人都不知道的pandas骚操作(一)
pandas有一种功能非常强大的方法,它就是accessor,可以将它理解为一种属性接口,通过它可以获得额外的方法。其实这样说还是很笼统,下面我们通过代码和实例来理解一下。 对于Series数据结构使用_accessors方法,我们得到了3个对象:cat,str,dt。 下面我…
从爬虫到机器学习预测,我是如何一步一步做到的?
前一段时间与大家分享了北京二手房房价分析的实战项目,分为分析和建模两篇。文章发出后,得到了大家的肯定和支持,在此表示感谢。 除了数据分析,好多朋友也对爬虫特别感兴趣,想知道爬虫部分是如何实现的。本篇将分享这个项目的爬虫部分,算是数据分析的一个 前传篇。 爬虫部分主要是通过爬取链…
机器学习“特征编码”的经验分享:鱼还是熊掌?
1. 为什么要进行特征编码? 我们拿到的数据通常比较脏乱,可能会带有各种非数字特殊符号,比如中文。下面这个表中显示了我们最原始的数据集。而实际上机器学习模型需要的数据是数字型的,因为只有数字类型才能进行计算。因此,对于各种特殊的特征值,我们都需要对其进行相应的编码,也是量化的过…
【Python数据分析基础】: 异常值检测和处理
本篇继续分享数据清洗中的另一个常见问题:异常值检测和处理。 在机器学习中,异常检测和处理是一个比较小的分支,或者说,是机器学习的一个副产物,因为在一般的预测问题中,模型通常是对整体样本数据结构的一种表达方式,这种表达方式通常抓住的是整体样本一般性的性质,而那些在这些性质上表现完…
下一页
个人成就
文章被点赞
1,161
文章被阅读
158,220
掘力值
4,586
关注了
8
关注者
5,213
收藏集
1
关注标签
7
加入于
2018-03-09