首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
xiaoyi
掘友等级
数据分析@小一的学习笔记
公众号:【小一的学习笔记】
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
56
文章 51
沸点 5
赞
56
返回
|
搜索文章
赞
文章( 51 )
沸点( 5 )
《吊打分析师》实战—深圳链家租房数据分析 | 附源码
所以这个系列打算多来点实战项目,像今天这种的,先做他十几二十个再说。 果然存在,有一条数据。 如果说这个字段不是主要字段,或者我们没有能力去填充它,那可能删了就删了。 最后只有一条记录“南山区--聚宁山庄“没有区域,需要我们手动填充一下。 终于,我们的重头戏算是落下帷幕了,你会…
标签编码、独热编码大不同 - Python 实现
如果讲水果这个无序栏位中的频果、香蕉、西瓜,Label 成0, 1, 2 会隐含着「香蕉跟苹果」比「西瓜跟苹果」还要相似的意义,但这样是错误的。 如果是年龄这个有序栏位的老年、中年、少年,Label 成 0, 1, 2 就很恰当,到如果硬转成 One-Hot 反而将这个差距关系…
2020 还不会泡 Github 你就落伍了
回想起两年前刚接触 GitHub 那会儿,就发现网上完全搜不到一篇关于 github 使用的文章,虽然自己倒腾几下慢慢的也就上手了,但毕竟花费了不少时间。 GitHub 作用:借助 github 托管项目代码。 对别人的代码进行了改进,向作者发出修改请求,作者同意后可以合并到它…
转行数据分析之前,希望你能看看这篇『长文+干货』
在总结大家问题的时候,我不禁想到了两三年前的自己。 那会儿,小一我也刚步入社会没多久,自己会的专业技能全是为后台开发准备的。 到了部门之后,因为日常工作更偏数据分析,所以我当时也面临和大家同样的问题。疑惑、迷茫、有力使不出来的感觉。 说到这,我的眼角似乎又湿了一片...... …
用数据来看疫情拐点—它真的来了吗?
上一篇文章发布于2月15号,但是我在12号就已经在爬数据了。 12号丁香园疫情平台新增“当前确诊人数”列,之前是没有这个字段的。 到目前为止,我们拿到最早的数据是1月23号, 全国总确诊866人。 23号之前的数据确实没有找到,这个我特意找过。 数据部分需要交待的就这些,我们的…
写了个自动化脚本,每日更新疫情数据
先说明一下,这是一篇爬虫+分析+自动化的文章,并不是上节说到的 NumPy 系列文章,NumPy 系列请期待下节内容。 小一我自从疫情发生了之后,每天早上第一件事就是关注微博热搜里面关于各地确诊人数的新闻,不得不说,确实很牵动人心,前几天的突增1w+,有点害怕,还好这几天降下来…
《Hello NumPy》系列-数据类型与创建
上节介绍了最常用的部分高阶函数,也是我在实际项目中觉得效率比较高的函数之一了。 今天开始新的系列,也是高阶部分的知识,难度会稍稍大一些,我打算多分几节。 NumPy(Numerical Python 的简称)是高性能科学计算和数据分析的基础包,是 SciPy、Pandas 等数…
下一页
个人成就
文章被点赞
121
文章被阅读
34,343
掘力值
1,165
关注了
10
关注者
282
收藏集
1
关注标签
32
加入于
2019-11-02