首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
hike
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
0
文章 0
沸点 0
赞
0
返回
|
搜索文章
最新
热门
Spark基础【RDD KV类型转换算子】
val rdd: RDD[(String,Int)] = sc.val rdd1: RDD[(String, Iterable[Int])] = rdd.val rdd2: RDD[(String, Int)] = rdd1.mapValues(_.val cleanF = sc...
Spark基础【RDD单Value类型转换算子】
RDD转换算子算子单Value类型1 map(1)案例:从服务器日志数据agent.6 groupBy(1)案例:将List("Hello","hive", "hbase", "Hadoop")根据单词首写字母进行分组。(2)案例:按照agent.val wordCount: R...
Spark基础【RDD转换算子】
将数据根据指定的规则进行筛选过滤,符合规则的数据保留,不符合规则的数据丢弃。val rdd: RDD[Int] = sc.val rdd1: RDD[Int] = rdd.rdd1.collect().当数据进行筛选过滤后,分区不变,但是分区内的数据可能不均衡,生产环境下,可能会...
Spark基础【RDD分区和并行度】
RDD(Resilient Distributed Dataset)叫做弹性分布式数据集,是Spark中最基本的数据处理模型。默认情况下,Spark可以将一个作业切分多个任务后,发送给Executor节点并行计算,而能够并行计算的任务数量称之为并行度。这个数量可以在构建RDD时指...
scala基础【高阶函数编程】
什么是高阶函数编程,所谓的高阶函数,其实就是将函数当成一个类型来使用,而不是当成特定的语法结构。println("fun1...println("fun1...万物皆对象,但是对象都有类型,就意味着函数对象也有类型,f1的类型是Function,后面的0为参数个数,泛型为返回值类...
论文翻译解读:learning logic rules for reasoning on knowledge graphs【RNNLogic】
Rnnlogic:在知识图谱上学习进行推理的逻辑规则简要信息摘要1 介绍2 相关工作3 模型3.1 概率形式化3.2 参数3.3 优化3.4 实验4.1 实验设置4.本文研究了知识图推理逻辑规则的学习。逻辑规则在用于预测时提供了可解释的说明,并能够推广到其他任务,因此对学习至关重...
论文翻译解读:Translating Embeddings for Modeling Multi-relational Data【TransE】
为建模多关系数据转换嵌入简要信息重要内容概括摘要1 介绍2 基于翻译的模型3 相关工作4 实验4.1 数据集4.2 实验设置4.3 链接预测4. 在低维向量空间中嵌入多关系数据的实体和关系。 对KBs中的多关系数据进行建模,提供高效的工具,不需要额外的知识,通过自动添加新的事...
数仓采集项目【01数仓概念、需求分析、技术框架】
数据仓库( Data Warehouse ),是为企业所有决策制定过程,提供所有系统数据支持的战略集合。通过对数据仓库中数据的分析,可以帮助企业,改进业务流程、控制成本、提高产品质量等。数据仓库,并不是数据的最终目的地,而是为数据最终的目的地做好准备。这些准备包括对数据的:清洗,...
kafka基础【数据重复消费、自定义拦截器、flume对接kafka、eagle监视器】
无论是同步提交还是异步提交offset,都有可能会造成数据的漏消费或者重复消费。先提交offset后消费,有可能造成数据的漏消费;而先消费后提交offset,有可能会造成数据的重复消费。(2)确保数据的消费和提交两个操作是原子性的,要么同时成功,要么同时失败。原子化绑定的前提是提...
kafka基础【kafka的概述、安装、命令行操作】
kafka是一个分布式的基于发布/订阅模式的消息队列(Message Queue)。类似于一个有顺序的缓冲区,将访问的信息缓冲起来,减少服务器的压力,主要应用于大数据实时处理领域。点对点模式:一对一,消费者主动拉取数据,消息收到后消息清除。消息生产者生产消息发送到Queue中,然...
下一页
个人成就
文章被点赞
2
文章被阅读
26,744
掘力值
479
关注了
0
关注者
2
收藏集
0
关注标签
2
加入于
2022-06-30