获得徽章 0
- GeneralNewsExtractor:基于《基于文本及符号密度的网页正文提取方法》论文用 Python 实现的正文抽取器,可以用来提取 HTML 中正文的内容、作者、标题。GitHub 地址:
hellogithub.com
HG 旁白:之前我看到这篇论文也想实现该抽取工具,但是我因为懒癌晚期躺下了,感谢kingname ‘带趟’️
展开评论10 - awesome-wechat-weapp:该项目收集了微信小程序开发过程中会使用到的资料、问题以及第三方组件库。随着微信小程序的市场越来越大,很多公司也专门以制作小程序为业,不论对感兴趣的人还是想自己动手做小程序的人而言,这份合集省去了不少查找资料的时间。项目地址:
github.com
「来自 HelloGitHub 第 37 期 其它 分类」:github.com
展开评论49 - 838
- 527
- 我写了一个新闻类网页的通用抽取器,目前使用今日头条、网易新闻、游民星空、观察者网、凤凰网、腾讯新闻、ReadHub、新浪新闻做了测试,发现提取效果非常出色,几乎能够达到100%的准确率,理论上可以自动抽取各种新闻网站。评论32
- 听说腾讯视频因为少了一个数字而导致严重语言失误,相关一条线的员工都被emmm..,小编不禁吓得吃了一根冰棍压压惊,同时向山东的朋友报以真诚的问候,你们一定会挺过去的~今天带来的项目呢,从名字上就很消暑,它是由阿里“爸爸”开源的,用来极速构建中后台应用的前端研发体系:ICE(飞冰),它可以通过 GUI 操作简化前端工程复杂度,同时通过适配器可接入不同的项目工程进行可视化管理,定制专有的前端工作台,同时提供丰富的 React/Vue 物料可进行拼装来提高项目开发效率,还可以自定义专属物料。快来解锁这个优秀的开源项目吧~小声逼逼:看来以后该校验的地方一定不能少啊,不然连冰棍都吃不起了,(°ー°〃)哭哭。
hellogithub.com
展开839