首页
首页
沸点
课程
直播
活动
竞赛
商城
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
Alink
罗西的思考
创建于2021-05-12
订阅专栏
Alink 是阿里巴巴基于实时计算引擎 Flink 研发的新一代机器学习算法平台,是业界首个同时支持批式算法、流式算法的机器学习平台。
等 4 人订阅
共29篇文章
创建于2021-05-12
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
Alink漫谈(二) : 从源码看机器学习平台Alink设计和架构
之前信息有误,分成了三篇文章发布,现在完整发出。 Alink 是阿里巴巴基于实时计算引擎 Flink 研发的新一代机器学习算法平台,是业界首个同时支持批式算法、流式算法的机器学习平台。本文是漫谈系列的第二篇,将从源码入手,带领大家具体剖析Alink设计思想和架构为何。 因为Al…
Alink漫谈(五) : 迭代计算和Superstep
之前信息有误,分成了两篇文章发布,现在完整发出。 Alink 是阿里巴巴基于实时计算引擎 Flink 研发的新一代机器学习算法平台,是业界首个同时支持批式算法、流式算法的机器学习平台。迭代算法在很多数据分析领域会用到,比如机器学习或者图计算。本文将通过Superstep入手看看…
Alink漫谈(二十二) :源码分析之聚类评估
Alink 是阿里巴巴基于实时计算引擎 Flink 研发的新一代机器学习算法平台,是业界首个同时支持批式算法、流式算法的机器学习平台。本文和上文将带领大家来分析Alink中 聚类评估 的实现。 聚类(Clustering),用通俗的话来说,就是物以类聚,人以群分。 聚类是观察式…
Alink漫谈(二十一) :回归评估之源码分析
Alink 是阿里巴巴基于实时计算引擎 Flink 研发的新一代机器学习算法平台,是业界首个同时支持批式算法、流式算法的机器学习平台。本文和将带领大家来分析Alink中 回归评估 的实现。 这是剖析Alink以来,最轻松的一次了。因为这里的概念和实现逻辑都非常清晰。 回归评估是…
Alink漫谈(二十) :卡方检验源码解析
Alink 是阿里巴巴基于实时计算引擎 Flink 研发的新一代机器学习算法平台,是业界首个同时支持批式算法、流式算法的机器学习平台。本文将带领大家来分析 Alink 中 卡方检验 的实现。 因为Alink的公开资料太少,所以以下均为自行揣测,肯定会有疏漏错误,希望大家指出,我…
Alink漫谈(十九) :源码解析 之 分位点离散化Quantile
Alink 是阿里巴巴基于实时计算引擎 Flink 研发的新一代机器学习算法平台,是业界首个同时支持批式算法、流式算法的机器学习平台。本文将带领大家来分析Alink中 Quantile 的实现。 因为Alink的公开资料太少,所以以下均为自行揣测,肯定会有疏漏错误,希望大家指出…
Alink漫谈(十八) :源码解析 之 多列字符串编码MultiStringIndexer
Alink 是阿里巴巴基于实时计算引擎 Flink 研发的新一代机器学习算法平台,是业界首个同时支持批式算法、流式算法的机器学习平台。本文将带领大家来分析Alink中 MultiStringIndexer 的实现。 因为Alink的公开资料太少,所以以下均为自行揣测,肯定会有疏…
Alink漫谈(十七) :Word2Vec源码分析 之 迭代训练
Alink 是阿里巴巴基于实时计算引擎 Flink 研发的新一代机器学习算法平台,是业界首个同时支持批式算法、流式算法的机器学习平台。本文和上文将带领大家来分析Alink中 Word2Vec 的实现。 因为Alink的公开资料太少,所以以下均为自行揣测,肯定会有疏漏错误,希望大…
Alink漫谈(十六) :Word2Vec源码分析 之 建立霍夫曼树
Alink 是阿里巴巴基于实时计算引擎 Flink 研发的新一代机器学习算法平台,是业界首个同时支持批式、流式算法的机器学习平台。本文和下文将带领大家来分析Alink中 Word2Vec 的实现。 因为Alink的公开资料太少,所以以下均为自行揣测,肯定会有疏漏错误,希望大家指…
[Alink漫谈之三] AllReduce通信模型
之前信息有误,分成了两篇文章发布,现在完整发出。 Alink 是阿里巴巴基于实时计算引擎 Flink 研发的新一代机器学习算法平台,是业界首个同时支持批式算法、流式算法的机器学习平台。本文将带领大家来分析Alink中通讯模型AllReduce的实现。AllReduce在Alin…
Alink漫谈(十五) :多层感知机 之 迭代优化
Alink 是阿里巴巴基于实时计算引擎 Flink 研发的新一代机器学习算法平台,是业界首个同时支持批式算法、流式算法的机器学习平台。本文和前文将带领大家来分析Alink中多层感知机的实现。 因为Alink的公开资料太少,所以以下均为自行揣测,肯定会有疏漏错误,希望大家指出,我…
Alink漫谈(十四) :多层感知机 之 总体架构
Alink 是阿里巴巴基于实时计算引擎 Flink 研发的新一代机器学习算法平台,是业界首个同时支持批式算法、流式算法的机器学习平台。本文和下文将带领大家来分析Alink中多层感知机的实现。 因为Alink的公开资料太少,所以以下均为自行揣测,肯定会有疏漏错误,希望大家指出,我…
Alink漫谈(十三) :在线学习算法FTRL 之 具体实现
Alink 是阿里巴巴基于实时计算引擎 Flink 研发的新一代机器学习算法平台,是业界首个同时支持批式算法、流式算法的机器学习平台。本文和上文一起介绍了在线学习算法 FTRL 在Alink中是如何实现的,希望对大家有所帮助。 书接上回 Alink漫谈(十二) :在线学习算法F…
Alink漫谈(十二) :在线学习算法FTRL 之 整体设计
Alink 是阿里巴巴基于实时计算引擎 Flink 研发的新一代机器学习算法平台,是业界首个同时支持批式算法、流式算法的机器学习平台。本文和下文将介绍在线学习算法FTRL在Alink中是如何实现的,希望对大家有所帮助。 因为 Alink 实现的是 LR + FTRL,所以我们需…
Alink漫谈(十一) :线性回归 之 L-BFGS优化
Alink 是阿里巴巴基于实时计算引擎 Flink 研发的新一代机器学习算法平台,是业界首个同时支持批式算法、流式算法的机器学习平台。本文介绍了线性回归的L-BFGS优化在Alink是如何实现的,希望可以作为大家看线性回归代码的Roadmap。 因为Alink的公开资料太少,所…
Alink漫谈(十) :线性回归实现 之 数据预处理
Alink 是阿里巴巴基于实时计算引擎 Flink 研发的新一代机器学习算法平台,是业界首个同时支持批式算法、流式算法的机器学习平台。本文和下文将介绍线性回归在Alink中是如何实现的,希望可以作为大家看线性回归代码的Roadmap。 因为Alink的公开资料太少,所以以下均为…
Alink漫谈(九) :特征工程之特征哈希/标准化缩放
Alink 是阿里巴巴基于实时计算引擎 Flink 研发的新一代机器学习算法平台,是业界首个同时支持批式算法、流式算法的机器学习平台。本文将剖析Alink “特征工程” 部分对应代码实现。 机器学习的特征工程是将原始的输入数据转换成特征,以便于更好的表示潜在的问题,并有助于提高…
Alink漫谈(八) : 二分类评估 AUC、K-S、PRC、Precision、Recall、LiftChart 如何实现
Alink 是阿里巴巴基于实时计算引擎 Flink 研发的新一代机器学习算法平台,是业界首个同时支持批式算法、流式算法的机器学习平台。二分类评估是对二分类算法的预测结果进行效果评估。本文将剖析Alink中对应代码实现。 在 Alink 中,二分类评估有批处理,流处理两种实现,下…
Alink漫谈(六) : TF-IDF算法的实现
0x00摘要0x01TF-IDF1.1原理1.2计算方法0x02Alink示例代码2.1示例代码2.2TF-IDF模型2.3TF-IDF预测0x03分词Segment3.1结巴分词3.2分词过程0x0
Alink漫谈 : 如何划分训练数据集和测试数据集
0x00摘要0x01训练数据集和测试数据集0x02Alink示例代码0x03批处理3.1得到记录数3.2随机选取记录3.3设置训练数据集和测试数据集0x04流处理0x05参考0x00摘要Alink是阿
下一页