艳烔

赞

50

|

搜索文章

大数据技术之大数据概论

大数据概念大数据（Big Data）：指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合，是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息

1年前
305
点赞
评论

图像验证码识别技术--Tesseract和ddddocr

阻碍我们爬⾍的。有时候正是在登录或者请求⼀些数据时候的图形验证码。因此这⾥我们讲解⼀种能将图⽚翻译成⽂字的技术。将图⽚翻译成⽂字⼀般被称为光学⽂字识别（Optical Character Reco

1年前
917
1
评论

爬虫与反爬虫之间的斗争爬虫的建议尽量减少请求次数能抓取列表⻚就不抓详情⻚保存获取到的HTML，供查错和重复使⽤关注⽹站的所有类型的⻚⾯ H5页面 APP 多伪装代理IP 不适用cookie

1年前
215
点赞
评论

爬虫数据-xpath

为什么要学习XPATH和LXML类库 lxml是⼀款⾼性能的Python HTML/XML解析器，我们可以利⽤Xpath来快速的定位特定元素以及获取节点信息什么是XPATH Xpath是⼀⻔在HT

1年前
148
1
评论

寻找网页编码格式(已解决)

问题: 最近在学习爬虫时,在爬取下来的网页源码中关于中文部分显示乱码解决在浏览器页面按F12,进入控制台(Console),输入:

1年前
74
点赞
评论

Windows 11 操作系统出现蓝屏终止代码 VIDEO_DXGKRNL_FATAL_ERROR(未解决)

问题: 在玩游戏(原神)时,突然蓝屏,终止代码 VIDEO_DXGKRNL_FATAL_ERROR 解决在查阅相关文档后: 方法一按win+R,输入cmd,以系统管理员的身份进行操作,输入方法二

1年前
1.9k
点赞
评论

爬虫数据-json

数据提取什么是数据提取？简单的来说，数据提取就是从相应中获取我们想要的数据的过程数据分类⾮结构化数据：HTML 处理⽅法：正则表达式、xpath 结构化数据：json、xml 处理⽅法：转化为

1年前
111
点赞
评论

Requests使用技巧

将cookie转为字典请求SSL证书验证 SSL证书验证: HTTPS = HTTP + SSL 设置超时配合状态码判断是否请求成功编解码 retrying

1年前
114
点赞
评论

在使用Pycharm时导入第三方库使用时没有提示想要的代码(已解决)

问题描述在使用Pycharm时,导入了requests库,想要使用utils.dict_from_cookiejar方法,但在提示中没有出现 AI已经给出想要提示,但并非Pycharm的提示解决

1年前
105
1
评论

爬虫requests库

网络爬虫靶场: https://spiderbuf.cn/list https://scrape.center/ 为什么要学习requests,而不是urllib? requests的底层实现就是ur

1年前
152
点赞
评论

个人成就

文章被点赞 54

文章被阅读 18,164

掘力值 1,114

加入于

2024-08-25