首页
首页
BOT
沸点
课程
直播
活动
AI刷题
NEW
商城
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
LeeRich
掘友等级
记录我的代码人生
iOS,Hadoop,Flink
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
5
文章 5
沸点 0
赞
5
返回
|
搜索文章
最新
热门
flink-Window Assingers(窗口分配器)中offset偏移量
指定完你的数据流是分组的还是非分组的之后,接下来你需要定义一个窗口分配器(window assigner),窗口分配器定义了元素如何分配到窗口中,这是通过在分组数据流中调用window(...)或者非分组数据流中调用windowAll(...)时你选择的窗口分配器(Window…
Flink-kafka消费分区动态发现
Flink Kafka Consumer 支持发现动态创建的 Kafka 分区,并使用精准一次的语义保证去消耗它们。在初始检索分区元数据之后(即,当 Job 开始运行时)发现的所有分区将从最早可能的 offset 中消费。 默认情况下,是禁用了分区发现的。若要启用它,请在提供的…
Flink的Window窗口start和end时间
这里就得到getWindowStartWithOffset应该返回的时间为xxxxx0,这个时间作为window的start起始时间。
机器学习K-means算法
同一聚类中的对象相似度较高,而不同聚类中的对象相似度较低。 通过迭代的方法,逐渐更新各聚类中心的值,直至得到最好的聚类结果。 b、在第K次迭代中,对任意一个样本,求其到c各中心的距离,将该样本归类到距离最短的中心所在的类。 d、对所有的c个聚类中心,如果利用b、c的迭代更新后,…
机器学习-决策树
上面的图就是决策树,最终的结果是心仪或者不心仪。决策树算法以树形结构表示数据分类的结果 决策树属于也只能非参数学习算法、可以用于解决(多)分类问题,回归问题。 回归问题的结果,叶子结点的平均值是回归问题的解。 什么是熵:熵的概念源于物理学,用于度量一个热力学系统的无序程度。 信…
机器学习-逻辑回归
经典机器学习算法,他们最本质的区别是分类思想(预测y的表达式)不同,有的是基于概率模型,有的是动态规划,表象的区别就是最后的损失函数不同。 损失函数分为经验风险损失函数和结构风险损失函数,经验风险损失函数反映的是预测结果和实际结果之间的差别,结构风险损失函数则是经验风险损失函数…
机器学习之梯度下降法
一. 前言:机器学习方法论 那么其实可以总结出关于“如何找到函数f(x)”的方法论。可以看作是机器学习的“三板斧”: 我们先把目光放在第三步上:How to pick the best one ? 我们的目标是让损失函数最小化。这就引出了下面需要介绍的方法:梯度下降是目前机器学…
机器学习之线性回归算法
线性回归算法的作用是使用单一特征来预测响应值。是一种根据自变量X预测因变量Y的方法。假设两个变量是线性相关的,那么我们要找到一个线性函数,根据特征或自变量X来精确预测响应值Y。 在这个回归模型中,我们尝试通过寻找最佳拟合线来最小化预测的误差——根据线性回归预测的结果误差最小。我…
HDFS NameNode 高可用实现意义
在 Hadoop 1.0 时代,NameNode 存在单点问题(SPOF,single point of failure ),一旦挂掉,整个 HDFS 都不能访问,而依赖它的 MapReduce、Hive、HBase 等都将无法正常服务。 一个 NameNode 有单点问题,如…
机器学习-简单的数据预处理和特征工程
我们发现,在量纲不同的情况下,以上的情况,不能反映样本中每一个特征的重要程度。这就需要数据归一化了。 一般来说,我们的解决方案是:把所有的数据都映射到同一个尺度(量纲)上。 最值归一化(normalization):把所有数据映射到0-1之间。最值归一化的使用范围是特征的分布具…
下一页
个人成就
文章被点赞
5
文章被阅读
32,647
掘力值
571
关注了
7
关注者
2
收藏集
1
关注标签
10
加入于
2018-01-02