生信3--使用python搭建生信流程之python交互式运行本地化blastn

563 阅读1分钟

最近正好用python重新搭建流程,就展示一下python和Linux系统的互动

os是operating system(操作系统)的缩写,所以Python的os模块封装了常见的文件和目录操作。

os.name 查看当前操作系统名称。windows平台下返回‘nt’,Linux则返回‘posix’。

os.path.exists() 判断括号内的文件是否存在,TRUE/FALSE,可以加入判断语句中。

os.devnull 在不同的系统上null设备的路径,在Windows下为‘nul’,在POSIX下为‘/dev/null’,一般/dev/null是垃圾缓存区,不需要输出的数据放置于此。

Python3.5之后的版本中,官方文档中提倡通过subprocess.run() 函数替代其他函数来使用subproccess模块的功能;类似于os.system(cmd)

建立一个linux下基于python运行makeblastdb函数代码如下,功能是如果不存在blast的db文件就运行

import os
import subprocess as sp

def build_blast_database_if_needed(seqs): #判断blastn所需要的db文件是否存在
    if not os.path.exists(seqs + '.nin'):
        with open(os.devnull, 'w') as devnull:
            sp.run('makeblastdb -dbtype nucl -in ' + seqs, stdout=devnull, shell=True, check = True)

os.popen(command) 是另一种交互运行linux命令的方法,好处是输出的文件对象可以再操作

下面就是一个运行blastn的python函数,返回的是一个列表,每一行blastn结果为列表中的一个元素,以\t字符分割, 后续可以对列表进行解析

def run_blastn(db, query, min_ident):
    build_blast_database_if_needed(db)
    
    cmd = 'blastn -db {} -query {}'.format(db, query) #.format()感觉比用%s,%d更好
    cmd += " -outfmt 6 -evalue 1e-5 -max_target_seqs 20"
    cmd += ' -perc_identity {}'.format(min_ident)
    
    f = os.popen(cmd)
    blast_hits = f.read().split("\n")
    f.close()
    
    return blast_hits

以上就是一个简单的如何用python交互式运行本地化blastn的过程