首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
踩到棉花咯
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
15
文章 2
沸点 13
赞
15
返回
|
搜索文章
踩到棉花咯
9月前
关注
spark-standalone模式
一、Spark-Standalone 模式的特点 独立运行 Spark-Standalone 模式是 Spark 自带的集群管理方式,不需要依赖其他外部资源管理器。它通过自...
0
评论
分享
踩到棉花咯
9月前
关注
hadoop的序列化和反序列化
1. Hadoop 序列化 (1)定义 序列化是指将对象转换为字节序列的过程。在 Hadoop 中,序列化是将数据对象转换为字节流,以便存储到文件系统(如 HDFS)中,或...
0
评论
分享
踩到棉花咯
9月前
关注
spark-配置yarn模式
环境准备 确保已正确安装并配置好 Hadoop 和 YARN。 确保已安装 Spark。 配置文件修改 修改 spark-env.sh 文件 复制模板文件:cp spark...
0
评论
分享
踩到棉花咯
9月前
关注
打包spark代码在集群中运行
. 代码打包 (1)使用 Maven 打包(适用于 Java/Scala 项目) 确保项目中有一个 pom.xml 文件,定义项目的依赖关系和构建配置。 在 pom.xml...
0
评论
分享
踩到棉花咯
9月前
关注
mysql数据库创建新数据库和数据表
一、创建新数据库 登录MySQL服务器 打开终端或命令行工具,使用以下命令登录MySQL服务器: bash 复制 将username替换为你的MySQL用户名,然后输入密码...
0
评论
分享
踩到棉花咯
9月前
关注
mysql数据库配置
1. 安装MySQL 下载与安装:从MySQL官网下载适合你操作系统的安装包,并按照安装向导进行安装。 初始化数据库:在安装过程中,MySQL通常会自动初始化数据库,包括创...
0
评论
分享
踩到棉花咯
9月前
关注
sparkSQL基本使用
1. 环境准备 在使用 SparkSQL 之前,需要确保已经安装了 Apache Spark,并且配置了 Spark 环境。可以通过以下命令启动 Spark Shell 来...
0
评论
分享
踩到棉花咯
9月前
关注
RDD-自定义分区器
. 什么是分区器(Partitioner)? 分区器的作用是将键值对RDD中的数据根据键(key)进行分区。分区器决定了每个键值对应该被分配到哪个分区中。Spark默认提供...
0
评论
分享
踩到棉花咯
9月前
关注
sparkSQL基本使用
1. 启动 Spark Shell Spark Shell 是一个交互式的 Scala 命令行工具,可以用来快速测试 Spark SQL 的功能。启动方法如下: bash ...
0
评论
分享
踩到棉花咯
9月前
关注
sparkSQL读入csv文件写入mysql
1. 环境准备 确保你已经安装了以下组件: Apache Spark MySQL 数据库 MySQL JDBC 驱动(确保 Spark 能够连接 MySQL 数据库) 2....
0
评论
分享
踩到棉花咯
9月前
关注
hadoop集群配置-ssh无密登录
SSH无密登录是Hadoop集群配置中的重要步骤,它可以让集群中的节点之间无需手动输入密码即可进行通信。以下是配置SSH无密登录的详细步骤: 1. 生成SSH密钥对 在主节...
1
评论
分享
踩到棉花咯
9月前
关注
spark-standalone模式
Apache Spark 是一种分布式计算框架,而 Spark 的 Standalone 模式是它的一种运行模式,以下是关于 Spark Standalone 模式的详细介...
1
评论
分享
踩到棉花咯
9月前
关注
RDD-数据清洗
RDD(Resilient Distributed Dataset)是Apache Spark中的一个核心概念,它是一个不可变的分布式数据集合。在数据清洗过程中,RDD可以...
0
评论
分享
踩到棉花咯
9月前
关注
打包spark代码在集群中运行
一、代码打包 使用 Maven 打包(适用于 Java/Scala 项目) 确保你的项目中有一个 pom.xml 文件,它定义了项目的依赖关系和构建配置。 在 pom.xm...
0
评论
分享
踩到棉花咯
9月前
关注
RDD算子-转换算子Map
在Apache Spark中,RDD(弹性分布式数据集)是Spark的核心数据结构,而转换算子(Transformation)是用于对RDD进行操作的函数,这些操作会返回一...
1
评论
分享
踩到棉花咯
9月前
关注
spark-shell中写代码
spark-shell 是 Apache Spark 的交互式命令行工具,它允许用户直接在命令行中编写和执行 Scala 或 SQL 代码来操作 Spark 集群。以下是一...
0
评论
分享
踩到棉花咯
9月前
关注
什么是RDD
RDD(Resilient Distributed Dataset)是弹性分布式数据集,是Apache Spark框架中的一个核心概念。以下是关于RDD的详细介绍: 一、基...
0
评论
分享
踩到棉花咯
9月前
关注
idea写spark程序
在 IntelliJ IDEA 中编写 Spark 程序是一个常见的开发场景。以下是一个详细的步骤指南,帮助你从头开始创建一个 Spark 程序: 1. 安装 Intell...
0
评论
分享
踩到棉花咯
9月前
关注
spark-配置yarn模式
Apache Spark 是一个分布式计算框架,而 YARN(Yet Another Resource Negotiator)是 Hadoop 的资源管理器,用于管理集群资...
0
评论
分享
踩到棉花咯
9月前
关注
spark-standalone模式
Apache Spark 是一种开源的分布式计算系统,而 Spark 的 Standalone 模式是它的独立集群模式,以下是关于 Spark Standalone 模式的...
0
评论
分享
下一页
个人成就
文章被点赞
3
文章被阅读
3,967
掘力值
141
关注了
0
关注者
4
收藏集
0
关注标签
2
加入于
2024-09-04