首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
lois在前往梦想的路上
掘友等级
—— 博观而约取,厚积而薄发
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
44
文章 31
沸点 13
赞
44
返回
|
搜索文章
赞
文章( 31 )
沸点( 13 )
Mysql 到 Hbase 数据如何实时同步,强大的 Streamsets 告诉你
很多情况大数据集群需要获取业务数据,用于分析。通常有两种方式: 第一种可以是在业务中编写代码,将觉得需要发送的数据发送到消息队列,最终落地到大数据集群。 第二种则是通过数据同步的方式,将关系型数据同步到大数据集群,可以是存储在 hdfs 上,使用 hive 进行分析,或者是直接…
time date datetime timestamp 傻傻分不清楚
时间格式对于任何一个工程师来说都是绕不开的知识,爬虫工程师同样如此。爬虫工程师要将不同网站的相同类型内容存放在同一个数据表当中,常见的有: 在数据库建表的时候,通常有5中字段类型让人选择: TIME、DATE、DATETIME、TIMESTAMP、YEAR。 YEAR 这样的时…
Apache Flume 入门教程
Apache Flume 是一个分布式,可靠且可用的系统,用于有效地从许多不同的源收集、聚合和移动大量日志数据到一个集中式的数据存储区。 Flume 的使用不只限于日志数据。因为数据源可以定制,flume 可以被用来传输大量事件数据,这些数据不仅仅包括网络通讯数据、社交媒体产生…
Apache Storm系列 之二( 轻松搞定 Storm 安装与启动)
Storm 是开源免费的分布实时计算系统(Apache Storm is a free and open source distributed realtime computation system)。这里提到了两个关键词: 至于如何从原理上理解 Storm 的特性,我会在后面…
【译】Apache Storm系列 之一(核心概念)
实时应用程序的逻辑被打包到 Storm 拓扑中。一个 Storm 拓扑类似于一个 MapReduce 任务。关键的区别在于 MapReduce 任务最终会结束,而拓扑会一直运行(当然,除非你强制 kill 掉拓扑相关的进程)。拓扑可以理解为通过数据流(Stream Groupi…
Apache Hadoop文档翻译之三(用户指南)
该文档是用户使用Hadpoop分布式文件系统(HDFS)的起点,不管是作为hadoop集群的一部分来使用还是独立的通用分布式文件系统。虽然在很多场景下HDFS被设计成“正常工作”即可,但是掌握更多的HDFS工作机制将有利于更好的配置以及诊断。 HDFS是使用Hadoop程序来实…
Apache Hadoop文档翻译之二(HDFS命令指南)
所有的HDFS命令使用bin/hdfs脚本来调用。空参数运行该脚本将展示所有命令的介绍。 Hadoop有一个选项解析框架,它采用解析通用选项以及运行类。 对Hadoop集群用户有用的诸多命令。 打印获取Hadoop jar以及依赖库所需的类路径。如果不带参数调用,则打印由命令脚…
Apache Hadoop文档翻译之一(HDFS架构)
HDFS是一个被设计用来运行在商用机器上的分布式文件系统。它跟现有的分布式文件系统有很多相似之处,但是,区别也很大。HDFS容错率高,并且被设计为部署在廉价机器上。HDFS提供对应用程序数据的高吞吐量访问,适用于具有大型数据集的应用程序。HDFS放宽了一些POSIX要求,以实现…
GitHub 服务中断 24 小时 11 分钟事故分析报告
UTC 时间 10 月 21 日 22:52,为了更换发生故障的 100G 光纤设备,美国东海岸网络中心与美国东海岸数据中心之间的连接被断开。连接在 43 秒后恢复,但这次短暂的中断引发了一系列事故,导致 24 小时 11 分钟的服务降级。
真▪一行代码完成从前端代码build到部署线上
在经历了6,7个项目同时开工,频繁发布测试 ,不得不学会一点偷懒的小技巧来提高效率了,所以这篇文章要讲的就是如何更加优化发布流程。 工作以来,经历了build后,然后用FileZilla上传服务器完成部署。再到前端打包后 ,在build仓库执行git push,后端在自动部署。…
下一页
关注了
74
关注者
0
收藏集
6
关注标签
6
加入于
2018-03-29