首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
艳烔
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
48
文章 48
沸点 0
赞
48
返回
|
搜索文章
最新
热门
HDFS概述
HDFS产出背景及定义 HDFS产出背景 随着数据量越来越大,在一个操作系统存不下所有的数据,那么就分配到更多的操作系统管理的磁盘中,但是不方便管理和维护,迫切需要一种系统来管理多台机器上的文件,这就
Hadoop 常见错误及解决方案
防火墙没关闭,或者没有启动YARN 主机名称配置错误 IP地址配置错误 ssh 没有配置好 root 用户和 muyi 两个用户启动集群不统一 配置文件修改不细心 不识别主机名称 解决办法: 在/et
Hadoop 常用端口号说明&集群时间同步
常用端口号说明 端口名称 Hadoop2.x Hadoop3.x NameNode 内部通信端口 8020 / 9000 8020 / 9000 /9820 NameNode HTTP UI 5007
Hadoop集群启动/停止方式总结&编写Hadoop集群常用脚本
集群启动/停止方式总结 各个模块分开启动/停止 (配置ssh 是前提) 常用 整体启动/停止 HDFS 整体启动/停止YARN 各个服务组件逐一启动/停止 分别启动/停止 HDFS 组件 启动/停止Y
(已解决)Hadoop之util.NativeCodeLoader: Unable to load native-hadoop library...
宿主机:Windows 11 虚拟机:VMware Pro 17 hadoop版本: 3.1.3 问题描述 在我编写了一个hadoop启停脚本并使用它时,在启动过程中出现了下面这个警告 这个警告通常不
Scrapy之item的介绍和使用
简单示例 Scrapy 是一个用于网络爬虫的 Python 框架,它可以帮助开发者快速编写爬虫程序来抓取网页内容。在 Scrapy 中,Item 是一种容器,用来保存从网页中提取的数据。它类似于 Py
Hadoop之配置日志的聚集
日志聚集概念:应用运行完成以后,将程序运行日志信息上传到 HDFS 系统上。 日志聚集功能好处:可以方便的查看到程序运行详情,方便开发调试。 注意:开启日志聚集功能,需要重新启动 NodeManage
Hadoop之历史服务器配置
Hadoop集群中配置历史服务器(History Server)的原因主要有以下几点: 日志记录和分析:历史服务器可以存储和展示集群运行过程中的日志信息,这对于监控、分析和调试Hadoop作业非常重要
Scrapy之实现翻页功能
Scrapy爬虫流程 问题: 如何实现翻页 爬取某网站尝试 创建项目 生成一个爬虫 更换start_urls 这样就可以实现url的翻页功能了 发送请求 启动程序,就可以获取数据了 取数据 获取详情页
Scrapy之logging模块的使用&logging basicConfig
Scrapy内置了强大的日志功能,可以帮助开发者跟踪爬虫的行为、调试问题以及记录重要信息。Scrapy的日志系统基于Python的标准logging模块,但提供了一些额外的功能和配置选项。 参考文档:
下一页
个人成就
文章被点赞
53
文章被阅读
8,843
掘力值
1,091
关注了
3
关注者
6
收藏集
0
关注标签
16
加入于
2024-08-25