首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
big data
订阅
葬爱家族永不为奴
更多收藏集
微信扫码分享
微信
新浪微博
QQ
10篇文章 · 0订阅
淘宝大数据之路
2003 年至今淘宝网从零开始飞速发展,走过了 13 个年头,支撑淘宝业务野蛮式生长背后是一套不断完善的技术平台,淘宝大数据平台,就是其中非常重要的一个组成部分,承担了数据采集、加工处理、数据应用的职责,淘宝大数据平台一路到今天,总共经历了三个大的阶段(如图 1),不同阶段面临了不一样的挑战,随着我的理解回顾下这些年大数据所经历过的故事: 图 1 数据仓库平台发展三个阶段 第一个阶段:RAC 时代 &n
ELK 5.x 搭建大规模日志实时处理系统
ELK(Elastic Stack)是软件集合 Elasticsearch、Logstash、Kibana 的简称,由这三个软件及其相关的组件可以打造大规模日志实时处理系统
卷皮的大数据之路
1、卷皮技术架构的演进之路 2、卷皮的数据产品之路
腾讯上万节点大规模集群的跨城自动迁移
前言 本文为腾讯移动分析MTA团队运维工程师方锦亮的分享 作者在腾讯一直从事数据相关领域的系统运营和运营平台的建设工作。目前主要负责 TDW 的系统运营,TDW 是腾讯内部最大的离线处理平台,也是国内最大的 HADOOP 集群之一。 在运营这么大集群的时候,运营面临各种各样的难题…
鹅厂上万节点大规模集群的跨城自动迁移(上)
TDW 是腾讯内部最大的离线处理平台,也是国内最大的 HADOOP 集群之一。在运营这么大集群的时候,运营面临各种各样的难题,在解决这些难题的过程中,团队提炼出来的一个运营理念,用两句话去描述。
服务端 I/O 性能大比拼:Node、PHP、Java 和 Go
理解应用程序的输入 / 输出(I/O)模型,意味着其在计划处理负载与残酷的实际使用场景之间的差异。若应用程序比较小,也没有服务于很高的负载,也许它影响甚微。但随着应用程序的负载逐渐上涨,采用错误的 I/O 模型有可能会让你到处踩坑,伤痕累累。
Kafka 在大数据生态系统中的价值
近几年, Apache Kafka 的应用有了显著的增长。Kafka 最新的客户包括 Uber, Twitter, Netflix, LinkedIn, Yahoo, Cisco, Goldman Sachs 等。Kafka 是个高可扩展的生产消费者系统。利用 Kafka 系统,用户可以发布大量的消息, 同时也能实时订阅消费消息。本文旨在说明 Kafka 如何在大数据生态系统中扮演越来越重要的角色。
【大数据实战】在线数据收集与存储
【大数据实战】在线数据收集与存储 http://click.aliyun.com/m/9403/
携程是如何把大数据用于实时风控的
携程作为国内 OTA 领头羊,每天都遭受着严酷的欺诈风险,个人银行卡被盗刷、账号被盗用、营销活动被恶意刷单、恶意抢占资源等。
鹅厂上万节点大规模集群的跨城自动迁移(下)
接上篇:鹅厂上万节点大规模集群的跨城自动迁移(上)