首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
takemefly
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
0
文章 0
沸点 0
赞
0
返回
|
搜索文章
最新
热门
Golddata如何采集需要登录/会话的网站数据?
本文将介绍使用GoldData半自动登录功能,来采集需要登录网站的数据。GoldData半自动登录功能,就是指通过脚本来执行登录,如果需要验证码或者其它内容需要人工输入时,可以通过收发邮件来执行登录流程。 为了讲解方便,我们以采集mydict的单词数据来讲解采集需要登录的网站数…
如何一步到位将级联数据融合到自关联表?
这每一条记录与一条父记录存在关联,通常将数据导入这样的表,是个有挑战性的问题,在这里我们将看到如何在GoldData中轻松做到这一点。 我们将关联数据方式设为"不关联,数据追加"即可,然后选择保存。接下来我们需要配制字段映射。我们对各字段编辑如下: 这样我们的数据融合映射的配制…
如何采集级联数据(比如最新省市县)呢?
通常抓取级联数数据情况不多,但要是真需要时,确多了一些麻烦,比如抓取商品分类级别信息等。本内容将讲述如何采集无限级联联数据,并以GoldData来抓取2019年最新的省市县三级为示例。 在数据集管理里,添加数据集area。如下图所示: 数据集相当于数据库中的表,只是字段是灵活的…
个人成就
文章被阅读
1,243
掘力值
56
关注了
30
关注者
0
收藏集
0
关注标签
2
加入于
2019-03-14