如何用 Python 提高效率

963 阅读4分钟
原文链接: zhuanlan.zhihu.com
经常有人说我应该学一门语言,比如 Python 之类,但是却不知道如何入门。这个时候很多人会推荐学各种 web 框架,scrapy 爬虫之类,门槛虽然不高,但是对于新人来说可能就半途而废了。大家需要的或许是通过编程来解决平时遇到的问题,将工作自动化。本文将通过简单的例子来说下 Python 如何提高效率,减少重复劳动的。

废话不多说,进入正题,首先安装 Python 和 pip, 教程网上很多,比如 廖雪峰的官方网站。 pip 可以理解为安装第三方库的软件包,另外教程里面没有特别说明以 Python2.7 版本为例子。

0x01 selenium 自动登录京东

0x02 SimpleHTTPServer 文件共享

0x03 豆瓣自动顶贴

0x04 摩尔斯密码

0x05 批量发邮件

0x06 自如爬虫

------------------------------------------------------------------------

0x01 selenium 自动登录京东

还记得前段时间阿里月饼事件,当事人因为用 js 脚本刷月饼被开除。直接编写 js 代码可能不够直观,所以本文我们用 selenium 来模拟浏览器执行自动化脚本,同样可以达到效果,比如自动登录京东。

  • 安装 selenium
    pip install selenium
    
  • 打开京东登录页,用 chrome devtools 查看元素, 我们需要做的步骤就是输入用户名和密码,点击登录按钮。

name = '****'
password = '****'

# 使用火狐作为默认打开的浏览器,确认已经安装火狐
driver = webdriver.Firefox()
driver.get("https://passport.jd.com/new/login.aspx")

elem_account = driver.find_element_by_name("loginname")
elem_password = driver.find_element_by_name("nloginpwd")

elem_account.clear()
elem_password.clear()

elem_account.send_keys(name)
elem_password.send_keys(password)

driver.find_element_by_id("loginsubmit").click()
只需要更改上面的用户名和密码就能运行脚本, 代码见 github
  • 其实 selenium 可以用来秒杀,抢手机,抢火车票。有验证码的时候,自动识别可能有误差,可以手工输入或者一些其他方式。。。

0x02 SimpleHTTPServer 文件共享

有时候你会想要跟一个局域网的人共享文件,如果文件太多,那么用微信一个一个传可能不太方便,这个时候就祭出 SimpleHTTPServer 这个杀器,一行代码都不用写,先 cd 到你需要共享的目录

$ cd /home/share/images

然后直接命令行输入

python -m SimpleHTTPServer

接下来用 ifconfig (windows 下是 ipconfig)查看你的内网 ip, 假设是 192.168.0.11, 在浏览器输入http://192.168.0.11:8000 即可看到

0x03 豆瓣自动顶贴

程序员喜欢是用代码解放双手,能懒则懒。举个例子,你在豆瓣上发布了一个帖子,希望过段时间就回复下来置顶,那么一个是手工回复,当然也可以写脚本来做

  • 首先登录豆瓣,进入你需要回复的帖子页面,打开 chrome dev_tools, 当点击回复帖子的时候,查看 NetWork, 可以看到如下图

这里面最重要的是 Cookie 这个东西,他记录了你的登录状态,所以用脚本其实只需要发送带这个 Cookie 的请求就行。
  • 三行代码就能搞定

# rv_comment 为你需要回复的字段
payloads = {'ck': 'n1iQ', 'rv_comment': 'up', 'start': '0', 'submit_btn': u'加上去'}

# Cookie 自己去填
headers = {'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.103 Safari/537.36', 'Cookie': '******'}

requests.post('https://www.douban.com/group/topic/93461964/add_comment', data=payloads, headers=headers)

代码见 github

  • 这种方式去刷帖肯定是有风险的,所以请大家谨慎使用

0x04 摩尔斯密码

这是一个很无聊的需求,哈哈,如果你想通过摩尔斯密码聊天的话, 或者跟暗恋的人表白

  • 安装依赖

pip install morse-talk
  • 将文字编码成摩尔斯密码


import morse_talk as mtalk
content = 'i love you'
mo_content = mtalk.encode(content)
print mo_content
  • 输出

..       .-..   ---   ...-   .       -.--   ---   ..-
  • 解摩尔斯码

import morse_talk as mtalk
mo_content = '-.--   ---   ..-'
content = mtalk.decode(mo_content)
print content
  • 输出

'YOU'

0x05 批量发邮件

如果有一天,老板过来给你一个很大的邮箱列表,要你给每个人发邮件,你该如何去做,最简单的就是写一个 python 程序

import smtplib
from email.mime.text import MIMEText

receiver = ['***', '***'] # 设置邮件接收人,这里是我的公司邮箱

host = 'smtp.163.com'  # 设置发件服务器地址
port = 25  # 设置发件服务器端口号
sender = '****'  # 设置发件邮箱
pwd = '*****'  # 设置发件邮箱的密码
body = 'hello' # 设置邮件正文,这里是支持HTML的

msg = MIMEText(body, 'html') # 设置正文为符合邮件格式的HTML内容
msg['subject'] = 'Hello world' # 设置邮件标题
msg['from'] = sender  # 设置发送人
msg['to'] = ';'.join(receiver)  # 设置接收人

s = smtplib.SMTP(host, port) 
s.login(sender, pwd)  # 登陆邮箱
s.sendmail(sender, receiver, msg.as_string())  # 发送邮件

不过由于每个垃圾邮件的屏蔽机制,很可能批量发送会被 spam 掉,所以可以使用 sendcloud 专门的发邮件服务接口。

代码见 github

0x06 自如爬虫

如果你想入门数据分析,但是苦于没有数据,那就看下文如何用 10 行代码写一个最简单的自如房源爬虫

首先我们通过分析看到自如手机版有个 url 如下: m.ziroom.com/list/ajax-g… 能够返回 json 数据


这个基本上包括了租房的一些重要信息,价格,小区,地铁沿线,朝向

所以要做的就是遍历这个地址得到所有的 json 数据

下面是代码

import requests
import time

with open('ziroom.txt', 'a+') as f:
    for i in xrange(10, 9001, 10):
        payload = {'step': i}
        res = requests.post('http://m.ziroom.com/list/ajax-get-data', data=payload)
        for i in res.json()['data']:
            print i['id']
            f.write(str(i)+'\n')
        time.sleep(3)