首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
Java大数据
订阅
圈圈555
更多收藏集
微信扫码分享
微信
新浪微博
QQ
8篇文章 · 0订阅
手把手教你搭建一个基于Java的分布式爬虫系统
在不用爬虫框架的情况下,我经过多方学习,尝试实现了一个分布式爬虫系统,并且可以将数据保存到不同地方,类似 MySQL、HBase 等。因为此系统基于面向接口的编码思想来开发,所以具有一定的扩展性,有兴趣的朋友直接看一下代码,就能理解其设计思想。
Mongodb集群部署
MongoDB中的一组副本是一群mongod进程,这些进程维护同样的数据集。副本集提供了冗余和高可用性,是生产环境部署的基础。 通过在不同的服务器上存储相同的数据,副本机制保证了一定程度的容错,即在一个数据库挂掉后,数据服务仍然可用。 在某些情况下,副本可以提升数据的读性能,因…
『 Spark 』7. 使用 Spark DataFrame 进行大数据分析
spark 系列第 7 篇,教你如何使用 apache spark dataframe 进行大数据分析
Sql性能优化梳理
前言 本文主要针对的是关系型数据数据库MySql。键值类数据库可以参考最简大数据Redis。先简单梳理下Mysql的基本概念,然后分创建时和查询时这两个阶段的优化展开。 1.0 基本概念简述 1.1 逻辑架构 第一层:客户端通过连接服务,将要执行的sql指令传输过来 第二层:服务…
物流 IT 控: (java POI) WMS 大数据 BOM 导入优化
MWS 系统中使用 java POI 打开大数据出现 OutOfMemory(内存溢出),本文针对性地优化了的 Excel(大数据 40000 + 行)的导入功能。
TensorFlow Java+eclipse下环境搭建
TensorFlow是一个使用数据流图进行数值计算的开放源代码软件库。图中的节点代表数学运算,而图中的边则代表在这些节点之间传递的多维数组(张量)。借助这种灵活的架构,您可以通过一个 API 将计算工作部署到桌面设备、服务器或移动设备中的一个或多个 CPU 或 GPU。 1.下…