首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
思路
订阅
DaneJiang31552
更多收藏集
微信扫码分享
微信
新浪微博
QQ
3篇文章 · 0订阅
大数据查询——HBase读写设计与实践
本项目主要解决 check 和 opinion2 张历史数据表(历史数据是指当业务发生过程中的完整中间流程和结果数据)的在线查询。原实现基于 Oracle 提供存储查询服务,随着数据量的不断增加,在写入和读取过程中面临性能问题,且历史数据仅供业务查询参考,并不影响实际流程,从系…
git 小札 - 流程总览
集中式版本管理(subversion)和分布式版本管理(git)的差异集中式集中式版本管理主要以文件变更列表的方式存储信息这类系统(cvs、subversion、perforce、bazaar等等)保
创建一个分布式网络爬虫的故事
作者通过创建和扩展自己的分布式爬虫,介绍了一系列工具和架构, 包括分布式体系结构、扩展、爬虫礼仪、安全、调试工具、Python 中的多任务处理等。以下为译文:大概600万条记录,每个记录有15个左右的字段。