首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
丰泽
掘友等级
小程序员
|
大大大公司
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
16
文章 16
沸点 0
赞
16
返回
|
搜索文章
最新
热门
Spark性能优化:诊断内存的消耗
1、每个Java对象,都有一个对象头,会占用16个字节,主要是包括了一些对象的元信息,比如指向它的类的指针。如果一个对象本身很小,比如就包括了一个int类型的field,那么它的对象头实际上比对象自己还要大。 2、Java的String对象,会比它内部的原始数据,要多出40个字…
Spring-data-jpa项目报错问题
异常:A component required a bean named 'entityManagerFactory' that could not be found.
RDD持久化,不使用RDD持久化的问题的工作原理
一、RDD持久化原理二、不使用RDD持久化的问题原理
共享变量、广播变量,累计器的工作原理图。
一、共享变量二、广播变量三、累加器
transformation和action的介绍
transformation和action。 transformation操作会针对已有的RDD创建一个新的RDD;而action则主要是对RDD进行最后的操作,比如遍历、reduce、保存到文件等,并可以返回结果给Driver程序。 例如,map就是一种transformat…
Spark-core(核心)的基本介绍
通常而言,Driver Application的执行与输出都是通过SparkContext来完成的。在正式提交Application之前,首先需要初始化SparkContext。SparkContext隐藏了网络通信、分布式部署、消息通信、存储能力、计算能力、缓存、测量系统、文…
Docker 安装常用软件记录
安装Dockeryum-yinstalldocker启动Docker后台服务servicedockerstart安装Mysqldockerpullmysql:5.7启动Mysql有3306端口先停止:
Linux运行jar包(hive离线计算项目)
一、将日志未清洗的数据放在Linux系统下/opt/log。 三、缺一个fastjson的jar包,命令:/usr/local/hadoop-2.6.4/share/hadoop/mapreduce/lib,然后xftp从项目里导进来jar包。 五、建外部表,建分区,导入数据。…
线程与进程的区别(基础面试题)
具有一定独立功能的程序关于某个数据集合上的一次运行活动,进程是系统进行资源分配和调度的一个独立单位. 进程的一个实体,是CPU调度和分派的基本单位,它是比进程更小的能独立运行的基本单位.线程自己基本上不拥有系统资源,只拥有一点在运行中必不可少的资源(如程序计数器,一组寄存器和栈…
Linux后台运行打包Jar的方法
1. 异常:Unknown system variable 'query_cache_size'
下一页
个人成就
文章被点赞
8
文章被阅读
76,119
掘力值
1,542
关注了
12
关注者
8
收藏集
0
关注标签
17
加入于
2018-05-05