首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
莫叹
掘友等级
爬虫/数据分析/数据可视化
|
梦想梦工厂
一切都是最好的安排
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
13
文章 10
沸点 3
赞
13
返回
|
搜索文章
赞
文章( 10 )
沸点( 3 )
数据分析案例练习——中国姓氏排行研究
这里值得一提的是数据表merge合并的时候需要统一转换数据类型和考虑数据有效性。我开始直接合并,报错,我试着用pd.astype()函数直接都转换为字符型,合并后发现260w+的数据少了接近200w数据。然后使用了pandas.to_numeric(arg,errors ='r…
姓氏人口奔波轨迹可视化
‘杜’姓出自五帝之一——唐尧的裔孙刘累之后,‘杜’姓自形成以来,至先秦时期分布区域已经相当广泛。在百家姓文库上面排名53位,全国人口占比0.42%,这里以‘杜’姓为例,查看人口从出生地到工作地的奔波轨迹。 然后通过geocoding地图工具获取到工作地的经纬度。 合并两表,得到…
新闻资讯爬虫,同步保存到数据库
数据来源港股金融界:http://hk.jrj.com.cn/资本邦:http://www.chinaipo.com/智通财经网:http://www.zhitongcaijing.com/腾讯财经:
Python 的整数与 Numpy 的数据溢出
看了图,我第一感觉就是数据溢出了。数据超出能表示的最大值,就会出现奇奇怪怪的结果。 然后,他继续发了张图,内容是 print(100000*208378),就是直接打印上图的 E[0]*G[0],结果是 20837800000,这是个正确的结果。 由于我一直忽视数据的表示规则(…
城市餐饮店铺数据处理与可视化分析
对数据进行处理,从‘口味’、‘环境’、‘服务’、‘消费’、‘性价比’这些条件入手,对不同种类餐饮店铺进行各类对比分析,分析上海人的餐饮喜好。 在粗略查看数据的时候,发现'口味','环境','服务'这三者的数据要么同时为异常值0,要么同时全部正常。为了证明这一猜想,查看'口味',…
空间数据分析以及QGIS数据加载
在Python中有一些空间分析的库,比如geopandas,但是真正使用起来,第三方软件QGIS会更加方便。 空间数据是指用来表示空间实体的位置、几何特征及其属性特征的数据。 目的:通过对空间数据的加工和分析获取需要的结论,包括空间查询、空间处理与计算、空间划分、空间统计...…
Pycharm各类操作与bug解决(不定期更新)
在文本里输入你需要设定的任何内容。
在下一次你的系统出问题前该准备的一点事情
每次系统出问题实在修不好时,重装系统后都会哭上三天三夜,包括桌面文件在内的C盘所有文件消失,环境变量得重新配置,各类服务得重新开启,许要东西需要重新设置,下载,安装,测试(还有可能会碰到天降bug....)。所以在系统出问题前你需要干些事儿,以尽量减少麻烦。 最近在某东上买了个…
Python多线程与多进程
先前在学习Python的过程中,有接触到多线程编程相关的知识点,先前一直都没有彻底的搞明白。今天转杯花一些时间,把里面的细节尽可能的梳理清楚。 进程(process)和线程(thread)是操作系统的基本概念,但是它们比较抽象,不容易掌握。关于多进程和多线程,教科书上最经典的一…
百度python面试经历记录
笔者是一名双非本科生,通过了百度北京互联网数据研发部的最后一轮面试。第一次写博客,写的很详细(其实是罗里吧嗦),给自己记录一段面试经历,同时也希望这次的面试给需要的同学提供一点经验帮助吧。 大三暑假末期,当时在一家B轮融资的金融互联网企业里面担任python爬虫实习生,但是实习…
下一页
个人成就
文章被点赞
82
文章被阅读
29,338
掘力值
587
关注了
11
关注者
45
收藏集
2
关注标签
7
加入于
2019-05-22