首页
首页
BOT
沸点
课程
直播
活动
AI刷题
NEW
商城
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
青南
高级数据挖掘工程师 @红杉中国
·
5年前
关注
屏蔽作者: 青南
举报
我写了一个新闻类网页的通用抽取器,目前使用今日头条、网易新闻、游民星空、观察者网、凤凰网、腾讯新闻、ReadHub、新浪新闻做了测试,发现提取效果非常出色,几乎能够达到100%的准确率,理论上可以自动抽取各种新闻网站。
新闻类网页正文通用抽取器
juejin.im
优秀开源项目
等人赞过
分享
评论
32
相关推荐
个人网站
基于 Vue3 开发的个人作品和专业技能的数字名片网站。
项目地址:
github.com
预览地址:
new.xcj.im
15 赞 ·
9 评论
做了个简单的access日志暂且数据过滤工具:
gitee.com
4 赞 ·
0 评论
#挑战每日一条沸点#
今天的干劲不错,凌晨2点半了,开源项目写得停不下来,很有意思,开源项目的名称叫做:yidocs-auto,是一个自动生成vitepress导航栏和侧边栏的工具,这次属于是彻底重构了
。
5 赞 ·
2 评论
相关推荐
个人网站
基于 Vue3 开发的个人作品和专业技能的数字名片网站。
项目地址:
github.com
预览地址:
new.xcj.im
15 赞 ·
9 评论
做了个简单的access日志暂且数据过滤工具:
gitee.com
4 赞 ·
0 评论
#挑战每日一条沸点#
今天的干劲不错,凌晨2点半了,开源项目写得停不下来,很有意思,开源项目的名称叫做:yidocs-auto,是一个自动生成vitepress导航栏和侧边栏的工具,这次属于是彻底重构了
。
5 赞 ·
2 评论