我们知道在购买股票的时候,可以使用历史数据来对当前的股票的走势进行预测,当然这只是对那些长期研究股票的人来说作用比较大。在进行走势分析的时候就需要对股票的数据进行获取并且进行一定的分析,当然了,现在人都是比较喜欢图形化的界面的,因此,我们在这里我们通过获取数据后实现数据可视化的方法来实现股票数据的分析。
首先数据的来源于我们比较熟悉的东方财富网www.eastmoney.com/ ,获取历史数据前我们对目标网站进行了分析,因为我们如果使用python爬虫高频率的访问一个固定的网站的话,容易触发该目的网站的反爬机制,将你对应的IP地址进行封禁,那么这个时候我们可以通过代理的方式,让目的网站无法识别到是哪一个IP地址访问的。自己搭建IP的成本比较高,建议大家选择购买第三方的。网上有很多的代理商,如果不知道怎么选的这里推荐一家靠谱的,亿牛云代理www.16yun.cn/。提供了2种模式的代理,api和隧道转发,现在大家对隧道的使用比较多,所以这里给大家分享下隧道的使用方式:
#! -*- encoding:utf-8 -*-
import requests
import random
# 要访问的目标页面
targetUrl = "http://httpbin.org/ip"
# 要访问的目标HTTPS页面
# targetUrl = "https://httpbin.org/ip"
# 代理服务器(产品官网 www.16yun.cn)
proxyHost = "t.16yun.cn"
proxyPort = "31111"
# 代理验证信息
proxyUser = "username"
proxyPass = "password"
proxyMeta = "http://%(user)s:%(pass)s@%(host)s:%(port)s" % {
"host" : proxyHost,
"port" : proxyPort,
"user" : proxyUser,
"pass" : proxyPass,
}
# 设置 http和https访问都是用HTTP代理
proxies = {
"http" : proxyMeta,
"https" : proxyMeta,
}
# 设置IP切换头
tunnel = random.randint(1,10000)
headers = {"Proxy-Tunnel": str(tunnel)}
resp = requests.get(targetUrl, proxies=proxies, headers=headers)
print resp.status_code
print resp.text
有了代理的加持,我们才获取股票数据的时候就会很顺利。后期的数据分析也会更方便,如果是对股票感兴趣并且爬虫技术也可以的小伙伴可以实践下,通过数据分析,投资股票赚点外快,但是投资有风险,大家需要谨慎选择。