获得徽章 0
- 这是 github 项目 geektime_dl 的一份 fork, 我做了如下修改
删除 sqlite 部分,让项目依赖更少(坏处是增多了不必要的请求)
修复 爬取过程中 cookie 失效的问题
修复 极客时间专栏使用阿里云点播服务 mp4 无法下载的问题
修复 html 样式混乱问题(渣前端,胡乱塞点样式,能看就好……(^O^))
极客时间最有价值的评论循环爬取
增加 ffmpeg 转码 shell 脚本(渣运维,写 python 脑仁疼,直接用shell吧:-D)
删除过多参数(懒得写参数), 账户密码/下载路径放配置文件中
删除测试脚本(不要喷...)
删除推送到 kindle (我真的不需要)
请勿传播,仅供学习展开评论1 - 分享一本开源可免费在线阅读的书籍《命令行中的数据科学》。
该书是由一名荷兰数据科学家 Jeroen Janssens 所编写,内容主要讲解了 80 多种实用的命令行工具,以及如何使用它们高效地获取、清洗、探索和建模数据。
在线阅读:www.datascienceatthecommandline.com
GitHub:github.com
展开评论11