首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
大数据
订阅
yeping
更多收藏集
微信扫码分享
微信
新浪微博
QQ
59篇文章 · 0订阅
[译] Python 与大数据:Airflow、 Jupyter Notebook 与 Hadoop 3、Spark、Presto
最近几年里,Python 已成为数据科学、机器学习和深度学习领域的一门流行的编程语言。只需再配上查询语言 SQL 即可完成大多数工作。SQL 很棒,用英语即可发出指令,且只需指示想要什么,而无需关心具体如何查询。这使得底层的查询引擎可以不改变 SQL 查询就能对其进行优化。Py…
漫谈千亿级数据优化实践:数据倾斜(纯干货)
数据倾斜是大数据领域绕不开的拦路虎,当你所需处理的数据量到达了上亿甚至是千亿条的时候,数据倾斜将是横在你面前一道巨大的坎。 迈的过去,将会海阔天空!迈不过去,就要做好准备:很可能有几周甚至几月都要头疼于数据倾斜导致的各类诡异的问题。
免费下载 | 这是第一本给产品经理的数据分析手册
不会数据分析的产品经理还是产品经理吗?为全面提升产品经理的数据分析能力,我们推出了互联网第一本给产品经理的数据分析手册~快来下载吧!
开源数据库 Greenplum Database 的实现解析
在本次分享中,曾文旌从 GPDB 架构入手,辅助以 SQL 和优化器的案例以及对 GPDB 的硬件和性能的分析,对 GPDB 实现进行了详细解析。分享最后,他还对比了 GPDB 的优势和局限性,并对 GPDB 的未来发展进行了展望。
产品经理必会的10种数据分析方法
作者 | 陈明,GrowingIO联合创始人&运营副总裁。毕业于斯坦福大学,先后就职于eBay、LinkedIn数据分析部门,有丰富的商务分析经验。 来源 | GrowingIO 2017 年第3期电子书《产品经理数据分析手册 | 能力升级必备》 随着人口和流量红利的下降,互联…
MongoDB、Hbase、Redis等NoSQL优劣势、应用场景
点击上方“民工哥技术之路”,选择“置顶公众号” 有趣有内涵的文章第一时间送达! NoSQL数据库在整个数据库领域的江湖地位已经不言而喻。在大数据时代,虽然RDBMS很优秀,但是面对快速增长的数据规模和日渐复杂的数据模型,RDBMS渐渐力不从心,无法应对很多数据库处理任务,这时N…
谭安林:大数据在智能外呼系统的应用
商业是一个价值交换的事情,并不是一个等价交换的事情,我们因为信息不对称,很有可能导致一些效应:赢者通吃。大家买一个什么东西,可能比较关注的是市场知名度比较高的,这种会导致有一些同样的质量,甚至质量更高更便宜的产品,他们曝光度没有那么高,他们销售的时候并不占优势。我们作为一个数据…
斗鱼实时计算平台的演进
我是吴瑞诚,来自斗鱼,很高兴能有机会和大家分享斗鱼 TV 实时计算平台的演进。
php 大数据量及海量数据处理算法总结
下面的方法是我对海量数据的处理方法进行了一个一般性的总结,当然这些方法可能并不能完全覆盖所有的问题,但是这样的一些方法也基本可以处理绝大多数遇到的问题。
携程酒店订单Elastic Search实战
随着订单量的日益增长,单个数据库的读写能力开始捉襟见肘。这种情况下,对数据库进行分片变得顺理成章。分片之后的写,只要根据分片的维度进行取模即可。可是多维度的查询应该如何处理呢?