首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
大数据
订阅
a__sand
更多收藏集
微信扫码分享
微信
新浪微博
QQ
12篇文章 · 0订阅
Spark 系列:『 Spark 』5. 这些年,你不能错过的 spark 学习资源
关于 spark 的一些好文,好站,好博客
用Elasticsearch构建电商搜索平台
一个中等的电商平台,每天都要产生百万条原始数据,上亿条用户行为数据。一般来说,电商数据一般有3种主要类型的数据系统: 关系型数据库 ,大多数互联网公司会选用mysql作为关数据库的主选,用于存储商品,用户信息等数据。 关系型数据库对于事务性非常高的OLTP操作(比如订单,结算等…
数据分析之去哪儿酒店
之前发了一篇爬取去哪儿自由行的数据后,有一个读者在后台问到我怎么爬取去哪儿酒店的数据。当时简单看了下,觉得难度不大。就跟他讲了下思路。因为当时爬取自由行的网站选取的是移动端。为了能让读者学习到更多的知识,我们今天选取了去哪儿的电脑端来进行爬取。其实爬虫的思路都是一样的,无非就是…
[译] Python 与大数据:Airflow、 Jupyter Notebook 与 Hadoop 3、Spark、Presto
最近几年里,Python 已成为数据科学、机器学习和深度学习领域的一门流行的编程语言。只需再配上查询语言 SQL 即可完成大多数工作。SQL 很棒,用英语即可发出指令,且只需指示想要什么,而无需关心具体如何查询。这使得底层的查询引擎可以不改变 SQL 查询就能对其进行优化。Py…
[译] 使用 Google Cloud 计算引擎和机器学习算法实现产品推荐 - SegmentFault
通过阅读这篇文章,你能够搭建起一个基本的环境用于支撑一个基础的推荐引擎,你也可以根据自己的需求不断的调整和完善它。在云平台上面运行推荐殷勤能够给开发者提供一个灵活、可拓展的解决方案。
构建基于Spark的推荐引擎(Python)
在学习Spark机器学习这本书时,书上用scala完成,自己不熟悉遂用pyshark完成,更深入的理解了spark对协同过滤的实现 在这里我们的推荐模型选用协同过滤这种类型,使用Spark的MLlib中推荐模型库中基于矩阵分解(matrix factorization)的实现。…
从Spark MLlib到美图机器学习框架实践
MLlib 是 Apache Spark 的可扩展机器学习库,旨在简化机器学习的工程实践工作,并方便扩展到更大规模的数据集。 一种经常引用的英文定义是「A computer program is said to learn from experience E with resp…
从原理到策略算法再到架构产品看推荐系统 | 附Spark实践案例
本文源自于前阵子连续更新的推荐系统系列,前段时间给朋友整理一个关于推荐系统相关的知识教学体系,刚好自身业务中,预计明年初随着业务规模增长,估摸着又要启动推荐相关的项目了,所以也是趁机把相关的知识结构梳理了一遍。这这里重新做整理,并额外做了一些增减,让整体逻辑会更通顺一点。
来自IBM | 使用 Apache Spark 和 Elasticsearch 构建一个推荐系统
推荐引擎是应用机器学习的最著名、最广泛使用、最有价值的用例之一。尽管有许多资源可用作训练推荐模型的基础,但解释如何实际部署这些模型来创建大型推荐系统的资源仍然相对较少。 本 Code Pattern 将演示使用 Apache Spark…