=========
文章首发公众号:早起python
=========
最近经常会有小伙伴在后台问哪里能获取最新或者历史疫情数据来做数据分析,那么本文就整理了几个提供疫情数据的思路,一起来看看吧!
1.GitHub
作为一名优秀的开发者,在遇到难题时当然要学会去GitHub找找思路,只需要在GitHub上搜索疫情数据就能看到很多大神做的疫情数据爬虫
甚至有些会项目提供数据接口(lab.isaaclin.cn/nCoV/),按照使用说明调用端口即可。注意请求频率哦
- 优点:使用方便,更新及时,两行代码即可取出数据
- 缺点:不够稳定,有时会挂,同时数据取出需重新清洗才可用于分析
2.AkShare
AkShare 是基于 Python 的开源数据接口库, 目的是实现对期货, 期权, 基金等衍生金融产品和另类数据从数据采集, 数据清洗加工, 到数据下载的工具, 满足金融数据科学家, 数据科学爱好者在数据获取方面的需求。那么这个提供金融数据的库目前也采集了网易和丁香园的疫情数据提供给大家
使用起来也很简单
import akshare as ak
epidemic_hist_all_df = ak.epidemic_hist_all() #获取全部历史数据- 优点:使用方便,两行代码即可取出数据,数据可直接用于分析
- 缺点:安装稍微有点麻烦,更新速度一般
3.R包:nCov2019
该R包是余光创博士在Github上发布了名为nCoV2019的R语言包,可以快速获取本次疫情相关统计数据。在R中一行代码即可安装。
remotes::install_github("GuangchuangYu/nCov2019")获取数据也很简单,只需要用x[],就能拿到全国的数据,如果[]中添加省的名字就能获取该省最新数据。当然也支持历史数据与全球数据查询(使用方法类似)。
甚至三行命令就能绘制全球疫情地图,加载包➡️取数据➡️画图小白也能轻松画出疫情地图
require(nCov2019)
x = get_nCov2019()
plot(x, region='china', chinamap=cn)- 优点:使用方便,两行代码即可取出数据,数据可直接用于分析
- 缺点:需要有R语言基础,安装稍微有点麻烦
4.狗熊会
每年中国R语言会议主办方,每天也会发布前一天的疫情详细数据,超懒人模式点击下载即可
- 优点:使用方便,直接下载,数据已经过整理可直接用于分析
- 缺点:更新频率较低,人工维护,每天更新一次
5.新冠肺炎疫情分析平台
如果需要直接交互式的疫情数据可视化,可以选择新冠肺炎疫情分析平台。由华南统计科学研究中心团队开发,华南统计科学研究中心团队收集国内外新冠病毒疫情数据,从多角度出发进行疫情分析,运用R + Shiny开发了一个新冠病毒肺炎疫情的实时交互分析平台。目前开放的功能包括基本情况、风险评估、病例分析以及国际情况。
=====================
我的公众号:早起python