首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
18518791112
掘友等级
产品经理
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
117
文章 117
沸点 0
赞
117
返回
|
搜索文章
赞
文章( 117 )
沸点( 0 )
Pandas 与数据整理
在 Tidy Data 论文中,Wickham 博士 提出了这样一种“整洁”的数据结构:每个变量是一列,每次观测结果是一行,不同的观测类型存放在单独的表中。他认为这样的数据结构可以帮助分析师更简单高效地进行处理、建模、和可视化。他在论文中列举了 五种 不符合整洁数据的情况,并演…
Netflix 推荐系统(part three)-个性主页生成
本文主要总结和翻译自Learning a Personalized Homepage。但这并不是完全和完整的翻译稿。 正如我们在之前的博客文章中所描述的那样,在Netflix,我们广泛使用个性化,并努力抓住向超过5700万用户中的每一个呈现正确内容的机会。 用户与我们的推荐互动…
Netflix推荐系统(Part Seven)-改善实验系统
如发现任何侵权行为,请联系我。 Netflix体验由一系列排名算法提供支持,每种算法都针对不同的目的进行了优化。 例如,主页上的Top Picks行根据视频的个性化排名提出建议,而Trending Now行也包含最近的流行趋势。 这些算法以及许多其他算法一起用于为超过1亿成员构…
流式处理框架storm浅析(下篇)
设计一个系统,来实现对一个文本里面的单词出现的频率进行统计。 这是一个简单的例子,topology也非常简单。整个topology如下: 1. 构建maven环境,添加storm依赖 2. 定义Topology 3. 实现WordReader Spout 第一个被调用的spou…
分布式数据库如何选择?去哪儿网数据库总监给出了这几点建议
在开源数据库大会(ODF)在京举办成功落幕之际,也许很多人依然沉浸在技术大餐中,因为这些技术正是每个从业者所关注甚至是自己的饭碗。只有这样的技术会议,才会引起技术的碰撞以及共鸣。正如会议很大的一个亮点,“MariaDB/MySQL vs PostgreSQL世纪大决战”,现场火…
10亿级订单系统分库分表设计思路!
作者:架构小黑| 微信公众号:架构师之巅一、背景随着公司业务增长,如果每天1000多万笔订单的话,3个月将有约10亿的订单量,之前数据库采用单库单表的形式已经不满足于业务需求,数据库改造迫在眉睫。二、
笔记 | Python 3 入门系列教程
引用 Bruce Eckel 的原话作为开篇 "Life is short, you need python",期待您早日加入 Python 队伍中来。
python 数据挖掘算法简要
数据挖掘是通过对大量数据的清理及处理以发现信息,并应用于分类,推荐系统,预测等方面的过程。 分析业务需求后,选择应用于需求业务相关的数据:业务原始数据、公开的数据集、也可通过爬虫采集网站结构化的数据。明确业务需求并选择好针对性的数据是数据挖掘的先决条件。 python字符串处理…
Elasticsearch 基础入门
ElasticSearch是一个基于 Lucene 的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于 RESTful web 接口。Elasticsearch 是用 Java 开发的,并作为 Apache 许可条款下的开放源码发布,是当前流行的企业级搜索引擎。设计…
HBase 集群监控
为什么需要监控?为了保证系统的稳定性,可靠性,可运维性。掌控集群的核心性能指标,了解集群的性能表现。集群出现问题时及时报警,便于运维同学及时修复问题。集群重要指标值异常时进行预警,将问题扼杀在摇篮中,不用等集群真正不可用时才采取行动。
下一页
关注了
0
关注者
1
收藏集
8
关注标签
53
加入于
2016-06-16