持续创作,加速成长!这是我参与「掘金日新计划 · 12月更文挑战」的第1天,点击查看活动详情。
在运维工作中,随着管理的网络设备逐渐增多,如果单靠人工手动维护,工作量会变得非常繁重,这时,你可以能会思考有没有什么办法能批量完成这些任务呢?答案是肯定有的,就平常工作中的网络设备巡检来说,运维设备少,半个小时完成,设备多的话估计要几个小时。废话不多说了,直接进入今天的主题吧。
场景模拟
假设有这样一个场景,某科技公司有20台服务器,12台网络设备。公司为确保这些设备每天能正常运行,所以,安排小刘每天上班第一件事就是巡检这些设备,并形成每天的巡检报告发给部门领导。
思路分析
上述场景这项工作重复性极强,如果通过手工执行效率不高,而且费事。所以,我们要采用脚本的方式帮我们完成这些事情。那么脚本又是如何完成呢?又是采用什么语言编写脚本呢?
脚本的编写可以拆分成以下几个步骤:
至于语言采用自己熟悉的脚本即可。本案例中采用python。采用它的原因是拥有丰富的第三方依赖包,语法简单。
完成需求
1、登录设备
目前设备大多采用的ssh或telnet方式远程登录设备,python中也同样有这两个登录方式的库。
- Telnet方式登录,执行如下命令
pip install telnetlib3
- SSH方式登录,执行如下命令
pip install paramiko
本案例采用Telnet方式登录,核心代码如下,把所有功能封装成功一个工具类,在这个类中实现上述的功能。
def loginHost(self):
try:
self.tn.open(self.host,port=23)
except:
logger.error("{}网络连接失败".format(self.host))
# 等待login出现后输入用户名,最多等待10秒 华为交换机登录 Username:
self.tn.read_until(b'Username: ',timeout=10)
self.tn.write(self.username.encode('ascii') + b'\n')
# 等待Password出现后输入用户名,最多等待10秒
self.tn.read_until(b'Password',timeout=10)
self.tn.write(self.password.encode('ascii')+ b'\n')
# 延时两秒再收取返回结果,给服务端足够响应时间
time.sleep(2)
# read_very_eager()获取到的是的是上次获取之后本次获取之前的所有输出
command_result = self.tn.read_very_eager().decode('ascii')
if 'Login incorrect' not in command_result:
logger.info("{}登录成功".format(self.host))
return True
else:
logger.warning("{}登录失败,用户名或密码错误".format(self.host))
return False
2、执行命令
登录成功之后,就可以执行相应的代码。本案例中实现两个方法去执行命令,一个是执行单条命令,一个是执行多条命令。核心代码如下:
def execute_single_command(self,command:str):
try:
self.tn.write(command.encode("ascii")+b"\n")
time.sleep(2)
command_result = self.tn.read_very_eager().decode("ascii")
logger.info("命令执行结果:{}".format(command_result))
return command_result
except:
logger.error("{}:命令执行失败".format(command))
def execute_batch_command(self,commands:list):
try:
resultSet=[]
if isinstance(commands,list):
for command in commands:
resultSet.append(self.execute_single_command(command))
return resultSet
else:
logger.warning("{}传递的参数错误,不是一个list列表")
return False
except:
logger.error("命令执行失败")
批量执行命令还是调用单条命令执行的函数,只不过传参时是一个命令列表。再通过一个for循环实现。
3、获取结果
执行命令函数是有返回值的,返回值是执行命令的结果。只要把这些结果保存起来即可。通过定义个方法,把这些结果写到一个文本中。核心代码如下:
def save_result(self,data):
try:
with open('{}_{}.txt'.format(self.host,datetime.now().strftime("%Y_%m_%d_%H_%M_%S")),mode="w") as f:
f.write(data)
except Exception as e:
logger.error("数据写入失败,原因是{}".format(e))
print('An exception occurred')
4、把结果形成报告
这个根据个人业务情况把巡检后的结果进行格式化,提取自己想要的值。形成表格或者其他的。本案例最终实现是把关键的值形成巡检表如下:
这部分实现起来比较复杂,用到的知识点比较多,后面会单独出一篇文章介绍如何把结果提取形成execl表格。
5、发送报告
发送报告的方式有很多种,例如:邮件,微信,钉钉,微信公众号,飞书等等。这些实现起来还是比较简单的,通过调用相应的接口即可完成。本案例采用邮件发送的方式。核心代码如下:
调用方法执行
telnet = TelnetClient("192.168.1.1","***","***")
telnet.loginHost()
res = telnet.execute_single_command("display version")
telnet.save_result(res)
执行结果如下:
如何获取全部代码
在WX搜索公众号"攻城狮成长日记",并回复发送“Telnet”就能轻松的获取。
本文正在参加「金石计划 . 瓜分6万现金大奖」 ”