利用人工智能实现小程序自动答题

502 阅读8分钟

作者:Yiutto,编程浪子

GitHub: github.com/Yiutto

之前有看到有人用python实现自动运行微信小程序《跳一跳》,后来看到别人用hash码实现《加减大师》的自动答题领取娃娃,最近一直在研究深度学习,为啥不用机器学习实现呢?不就是一个分类问题吗!

如何实现自动答题微信小游戏《加减大师》?

思考:

  • 图像识别吗?
  • 如何建立特征工程?
  • 选用什么算法?

一、图像特征工程

如何获取手机游戏上的图片?

  • 使用adb命令截取手机屏幕;
  • 在PC端和手机端同时运行APowerMirror软件,将手机投屏到电脑上,然后使用Pillow包中的截图方法截取电脑上对应手机屏幕的 区域。
  • 在PC端和手机端同时运行APowerMirror软件,将手机投屏到电脑上,然后使用Python调用windows的原生API截取电脑上对应手机屏幕的区域。

实验结果: 三种截屏方式花费的时间差异很大,第一种每次截屏需要0.7s左右,第二种0.3s左右,第三种0.04s左右。

当然选择第3种咯,下载地址[www.apowersoft.cn/phone-mirro…

获取训练样本

相关步骤:

1. util.py中的 shotByWinAPI函数:首先利用window自带api获取全屏图片,然后自定义 config.py的相关参数。

  1. # 从PC端截屏时,截取区域左上角相对桌面的x坐标
  2. 'projection_x': 32,
  3. # 从PC端截屏时,截取区域左上角相对桌面的y坐标
  4. 'projection_y': 278,
  5. # 从PC端截屏时,截取区域的宽度
  6. 'projection_width': 482,
  7. # 从PC端截屏时,截取区域的高度
  8. 'projection_height': 854,

可以用window命令键 PrtScSysRq(F12的右边),然后复制到画图中(1920x1080)。640?wx_fmt=png


用画图的放大镜放大,图中红色框的小方块位置(32x278) projection_x即32, projection_y即278。

640?wx_fmt=png


在画图中计算出截图的宽度和高度,即 projection_width和 projection_height(482x854) 

640?wx_fmt=png

2. img_tool.py函数介绍:主要是通过 all(img,filename)函数进行图片分割

  1. srcImg = cv2.imread(os.path.join("ScreenShotForTrain", f), 0)

上述代码是为了将彩色图片灰度模式加载

640?wx_fmt=png

  1. def all(img, filename):
  2.    """封装对图片的所有操作"""
  3.    img = cropImg(img)
  4.    img = binaryImg(img)
  5. ``
  6.    img1, img2 = cropAgain(img)
  7. ``
  8.    imgs = cutImg(img1, filename + '_1') + cutImg(img2, filename + '_2')
  9. ``
  10.    return imgs
  11. ``
  12. def cropImg(img):
  13.    """裁剪原始截图"""
  14.    height = img.shape[0]
  15.    img2 = img[int(config.config['exp_area_top_rate'] * height):int(config.config['exp_area_bottom_rate'] * height),:]
  16.    #print('裁剪完毕')
  17.    return  img2

cropImg(img)函数主要是为了裁剪含有数字的区域,通过设置参数

  1. #表达式区域的顶部处于整张图片的位置(307/854=0.359)
  2. 'exp_area_top_rate': 0.36,
  3. #表达式区域的底部处于整张图片的位置(478/854=0.559)
  4. 'exp_area_bottom_rate': 0.56,

如果觉得设置比例太麻烦,可以直接写死位置( img2=img[int(307):int(478),:])。得到如下图:

640?wx_fmt=png

  1. def binaryImg(img):
  2.    """二值化图片"""
  3.    ret, thresh1 = cv2.threshold(img, config.config['binary_threshold'], 255, cv2.THRESH_BINARY)
  4.    # ret, thresh1 = cv2.threshold(img, config.config['binary_threshold'], 255, cv2.THRESH_BINARY_INV)
  5.    #print('二值化完毕')
  6.    return thresh1

binaryImg(img)函数主要是为了将图片二值化,可以参考 Python+OpenCV教程6:阈值分割。得到的图片如下图:

640?wx_fmt=png


  1. def cropAgain(img):
  2.    """再次裁剪"""
  3.    height = img.shape[0]
  4.    img1 = img[0:int(0.5 * height), :]
  5.    img2 = img[int(0.5 * height):height, :]
  6.    #print('再次裁剪完毕')
  7.    return img1, img2

cropAgain(img)函数主要是为了将图片分成上下两部分

640?wx_fmt=png 640?wx_fmt=png


  1. def cutImg(img, filename):
  2.    """水平分割图片"""
  3.    sb = np.array(img)
  4.    print(sb.shape)
  5.    sum_list = np.array(img).sum(axis=0)
  6.    start_index = -1
  7.    res = []
  8.    names = []
  9.    index = 0
  10.    for sum in sum_list:
  11.        if sum > 255 * 4:
  12.            if start_index == -1:
  13.                start_index = index
  14.        else:
  15.            if start_index != -1:
  16.                if config.config['type'] == 0:
  17.                    sigleCharWidth = config.config['abd_single_char_width']
  18.                else:
  19.                    sigleCharWidth = config.config['pc_single_char_width']
  20.                #为了防止字符粘连,需要在此处宽度进行判断
  21.                if index - start_index > sigleCharWidth * 2:
  22.                    res.append((start_index,start_index + (index - start_index) // 2))
  23.                    res.append((start_index + (index - start_index) // 2, index))
  24.                else:
  25.                    res.append((start_index, index))
  26.                start_index = -1
  27.        index += 1
  28. ``
  29.    imgs = []
  30.    count = 0
  31.    for single_char in res:
  32.        start = single_char[0]
  33.        end = single_char[1]
  34.        sub_img = img[:, start:end]
  35.        sub_img = cv2.resize(sub_img, (120, 240), interpolation=cv2.INTER_CUBIC)
  36.        #cv2.imwrite('SingleChar/%s_%d.png' % (filename, count), sub_img)
  37.        #names.append('%s_%d.png' % (filename, count))
  38.        # cv2.imshow(str(count), sub_img)
  39.        imgs.append(sub_img)
  40.        count += 1
  41.    # cv2.waitKey()
  42.    #print('分割,重新设置大小 %s 完毕' %filename)
  43.    return  imgs

设置 pc_single_char_width参数值,得到如下图:

640?wx_fmt=png


  1. c = 0
  2. def v_cut(img):
  3.    global c
  4.    """竖直方向切割图片"""
  5.    sb1 = np.array(img)
  6.    print(sb1.shape)
  7.    sum_list = np.array(img).sum(axis=1)
  8.    start_index = -1
  9.    end = -1
  10.    index = 0
  11.    for sum in sum_list:
  12.        if sum > 255 * 2:
  13.            start_index = index
  14.            break
  15.        index += 1
  16.    for i in range(1, len(sum_list) + 1):
  17.        if sum_list[-i] > 255 * 2:
  18.            end = len(sum_list) + 1 - i
  19.            break
  20.    img = img[start_index:end, :]
  21.    img = cv2.resize(img, (30, 60), interpolation=cv2.INTER_CUBIC)
  22.    #cv2.imwrite('SingleChar/%d.png' %c, img)
  23.    c += 1
  24.    return img

重新固定图片的大小(30x60),得到如下图:

640?wx_fmt=png 640?wx_fmt=png 640?wx_fmt=png 640?wx_fmt=png 640?wx_fmt=png

640?wx_fmt=png 640?wx_fmt=png 640?wx_fmt=png


二、训练模型,建立LR分类器

相关代码请看 ml.py,这里不过多介绍,直接利用python包 fromsklearn.linear_modelimportLogisticRegression

  1. LogisticRegression(class_weight='balanced')

sklearn逻辑回归(Logistic Regression,LR)类库使用小结

三、自动答题模式开启

实现原理

  • 截取游戏界面,本项目中提供了三种方案。 在PC端和手机端同时运行APowerMirror软件,将手机投屏到电脑上,然后使用Python调用windows的原生API截取电脑上对应手机屏幕的区域。

  • 提取截屏图片中的表达式区域并进行文字识别,得到表达式字符串。 由于图片中的表达式区域固定,而且字符规整,因此这一步不是很困难,我仅仅训练了一个简单的逻辑回归模型就得到了非常高的识别正确率。

    \

  • 根据第二步得到的表达式,调用Python的eval()函数,得到表达式结果的正误,然后点击手机屏幕的相应区域。当截图使用投屏的方案时,点击手机屏幕通过代码点击 电脑上手机的对应区域。\

首次操作,生成分类器模型

1.借用投屏软件,利用画图工具配置相关参数 config.py,可以参考上面的“图像特征工程”

2.对于新的手机(我用的是honor8),必须重新训练模型,设置 config.py中的 debug参数为True,打开“加减大师”,然后运行 main.py,这里必须手动答题,尽可能多答对一些题,目的为了扩充训练样本。

3.步骤2会产生一个 SingleCharForTrain文件夹,剔除重复样本和无关样本。

4.运行 img_tool.py文件,会生成一个 SingleCharForTrain文件夹。

5.将步骤4得到的文件夹中的字符进行人工分类,保存至 TrainChar文件夹。

6.运行 ml.py文件,生成分类器模型 lr.pickle

注意桌面上不要有东西遮挡到手机的投影区域

根据分类器模型自动答题

1.修改 config.py中的 debug参数为False及其他相关参数。

  1. #使用PC进行截图时点击手机屏幕正确区域的x坐标
  2. 'pc_tap_true_x':117,
  3. #使用PC进行截图时点击手机屏幕错误区域的x坐标
  4. 'pc_tap_false_x':365,
  5. #使用PC进行截图时点击手机屏幕正确和区域的y坐标
  6. 'pc_tap_y':760,

配置正确和错误选择的横纵坐标,横坐标不一样,纵坐标相同(在同一高度)

2.打开加减大师,直接运行 main.py即可。

640?wx_fmt=gif

遇到的问题

Q1: 跑到200步左右就停了?

A1: 如果是误判的话,把出错的那张图重新截图,将得到的字符添加到 TrainChar文件夹中,重新训练模型

A1: 如果是上一张图和这张图相同,再跑一次呗,不相信你运气会那么差

Q2: 刷到1000分,结果小程序上不了分

A2: 刚开始以为是答题时间没有设置随机的问题,设置 main.py

  1. one_tap(res)
  2. # 设置随机睡眠时间,随机性防止微信后台检测
  3. if (count < 100):
  4.    time.sleep(0.1 * (random.randint(0, 9)))
  5. elif (count <200):
  6.    time.sleep(0.05 * (random.randint(0, 9)))
  7. elif (count <300):
  8.    time.sleep(0.01 * (random.randint(0, 9)))
  9. elif (count < 400):
  10.    time.sleep(0.01 * (random.randint(0, 9)))
  11. elif (count < 500):
  12.    # 可以控制到这一关gg
  13.    if (count == 455):
  14.        time.sleep(3)

然而并没有软用,估计是后台设置(个人认为,当天的分数不能超过第一名太多),反正是前500都能获得小卡片,你可以尝试设置比第一名多个几分或少几分。

记得给哥们的github打♥啊,上代码:

  1. https://github.com/Yiutto/WechatGame_jjds

最后放出我的娃娃来,手机上显示的是这样的

640?wx_fmt=png

到手的时候却是这样的(本来以为没戏了,等了将近一个星期)

640?wx_fmt=png

最后,祝大家都能拿到娃娃!!!

640?wx_fmt=jpeg

640?wx_fmt=gif

Python中文社区作为一个去中心化的全球技术社区,以成为全球20万Python中文开发者的精神部落为愿景,目前覆盖各大主流媒体和协作平台,与阿里、腾讯、百度、微软、亚马逊、开源中国、CSDN等业界知名公司和技术社区建立了广泛的联系,拥有来自十多个国家和地区数万名登记会员,会员来自以公安部、工信部、清华大学、北京大学、北京邮电大学、中国人民银行、中科院、中金、华为、BAT、谷歌、微软等为代表的政府机关、科研单位、金融机构以及海内外知名公司,全平台近20万开发者关注。

640?wx_fmt=jpeg

点击阅读原文,从零开始学习Python数据分析