1. 启动Spark
进入目录/usr/local/spark/sbin下,利用如下命令启动Spark服务
./start-all.sh
进入目录/usr/local/spark/bin下,启动spark-shell
./spark-shell
2. 计算Tom同学的总成绩平均分
2.1 读取数据文件
这里我把chapter5-data.txt这个文件放在了/home/hadoop目录下
2.2 解析数据
2.3 过滤出Tom的成绩数据
2.4 计算Tom的成绩总和、成绩平均值
- 取出tom的每科成绩转换为数组
- 计算总和及科目总数
- 计算平均值