首页
首页
沸点
课程
直播
活动
竞赛
商城
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
莫叹
掘友等级
爬虫/数据分析/数据可视化
|
梦想梦工厂
一切都是最好的安排
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
13
文章 10
沸点 3
赞
13
返回
|
搜索文章
最新
热门
姓氏人口奔波轨迹可视化
‘杜’姓出自五帝之一——唐尧的裔孙刘累之后,‘杜’姓自形成以来,至先秦时期分布区域已经相当广泛。在百家姓文库上面排名53位,全国人口占比0.42%,这里以‘杜’姓为例,查看人口从出生地到工作地的奔波轨迹。 然后通过geocoding地图工具获取到工作地的经纬度。 合并两表,得到…
数据分析案例练习——中国姓氏排行研究
这里值得一提的是数据表merge合并的时候需要统一转换数据类型和考虑数据有效性。我开始直接合并,报错,我试着用pd.astype()函数直接都转换为字符型,合并后发现260w+的数据少了接近200w数据。然后使用了pandas.to_numeric(arg,errors ='r…
各大企业招聘数据抓取思路以及细节处理
要求从boss直聘、前程无忧、智联招聘、中华英才网四大招聘网站里选取其中一个招聘网站抓取数据。首先实现全量数据抓取,接着增量数据抓取,以后每日自动更新数据库数据。 为了不给后续抓取过程中留坑,也为了能够尽快完美的完成任务,选择一个易于抓取和稳定的网站至关重要。花了2-3天研究了…
城市餐饮店铺数据处理与可视化分析
对数据进行处理,从‘口味’、‘环境’、‘服务’、‘消费’、‘性价比’这些条件入手,对不同种类餐饮店铺进行各类对比分析,分析上海人的餐饮喜好。 在粗略查看数据的时候,发现'口味','环境','服务'这三者的数据要么同时为异常值0,要么同时全部正常。为了证明这一猜想,查看'口味',…
网络巨头思科官网资源文件抓取
思科是一家世界500强企业,尤其在通讯领域是顶尖的存在,它是全球领先的互联网解决方案供应商,提供了企业网络、数据中心、安全协作以及物联网(loT)等解决方案。在思科的官网提供了关于交换机、路由器、无线和有线网络或其他的一些产品的产品手册、白皮书、产品简介、设计指南、解决方案等等…
数据分析—缺失值处理
缺失值的删除需要按照具体数据情况和业务情况来处理,有时候需要删除全部缺失数据,有时候需要删除部分缺失数据,有时候只是需要删除指定缺失数据。 上面讲到缺失值的填充,但是在实际的数据处理过程中,对于缺失值的处理不是随便找个数据全部填充,而是有针对性的对每个局部缺失值进行插值填充。 …
QGIS空间数据分析——空间数据基本处理与计算
总的来说就是提取与裁剪要素相重叠的输入要素,可用如下图来理解。 然后在‘裁剪弹窗’中矢量图层选择待被裁剪的图层,裁剪图层选择要裁剪出的要素图层,传入文件输出地址,确定即可。 如下图所示,点为餐饮店铺,面为上海行政边界图,通过裁剪,其中重叠部分即为在上海行政范围内的餐位店铺分布。…
空间数据分析以及QGIS数据加载
在Python中有一些空间分析的库,比如geopandas,但是真正使用起来,第三方软件QGIS会更加方便。 空间数据是指用来表示空间实体的位置、几何特征及其属性特征的数据。 目的:通过对空间数据的加工和分析获取需要的结论,包括空间查询、空间处理与计算、空间划分、空间统计...…
在下一次你的系统出问题前该准备的一点事情
每次系统出问题实在修不好时,重装系统后都会哭上三天三夜,包括桌面文件在内的C盘所有文件消失,环境变量得重新配置,各类服务得重新开启,许要东西需要重新设置,下载,安装,测试(还有可能会碰到天降bug....)。所以在系统出问题前你需要干些事儿,以尽量减少麻烦。 最近在某东上买了个…
Pycharm各类操作与bug解决(不定期更新)
在文本里输入你需要设定的任何内容。
下一页
个人成就
文章被点赞
82
文章被阅读
24,915
掘力值
573
关注了
11
关注者
43
收藏集
2
关注标签
7
加入于
2019-05-22