数据科学初学者的20个基本Linux命令

178 阅读2分钟

20 Basic Linux Commands for Data Science Beginners
照片: Lukason Unsplash

1.ls

ls命令用于显示当前目录中所有文件和文件夹的列表。

输出

AutoXGB_tutorial.ipynb  binary_classification.csv      requirements.txt

Images/                 binary_classification.csv.dvc  test-api.ipynb

LICENSE                 output/

README.md               output.dvc

2.pwd

它将显示当前目录的完整路径。

输出

C:\Repository\HuggingFace

3.cd

cd命令代表改变目录。通过输入一个新的目录路径,你可以改变当前目录。这个命令对于探索有多个文件夹的目录是必不可少的。

$ cd C:/Repository/GitHub/

cd command

4.wget

wget

允许你从互联网上下载任何文件。在数据科学中,它用于从数据库中下载数据。

$ wget https://raw.githubusercontent.com/uiuc-cse/data-fa14/gh-pages/data/iris.csv

输出

wget command

5.cat

Cat(连接)是一个经常使用的命令,用于创建、连接和查看文件。cat

命令读取CSV文件并将文件内容显示为输出。

输出

sepal_length,sepal_width,petal_length,petal_width,species

5.1,3.5,1.4,0.2,setosa

4.9,3,1.4,0.2,setosa

4.7,3.2,1.3,0.2,setosa

4.6,3.1,1.5,0.2,setosa

5,3.6,1.4,0.2,setosa

………………………..

6. wc

wc

(字数统计)用于获取字数、字符数和行数的信息。在我们的例子中,它显示4列作为输出。第一列是行数,第二列是字数,第三列是字符数,第四列是文件名。

输出

7. head

head命令显示一个文件中的前n

行。在我们的例子中,它显示的是iris.csv文件中的前5行。

输出

sepal_length,sepal_width,petal_length,petal_width,species

5.1,3.5,1.4,0.2,setosa

4.9,3,1.4,0.2,setosa

4.7,3.2,1.3,0.2,setosa

4.6,3.1,1.5,0.2,setosa

8.find

find

命令用于查找文件和文件夹,通过使用`-exec`,你可以在文件和文件夹上执行其他Linux命令。在我们的例子中,我们要找到所有以".dvc "为扩展名的文件。

$ find . -name "*.dvc" -type f

输出

./binary_classification.csv.dvc

./output.dvc

9. grep

它用于过滤一个特定的模式,并显示所有包含该模式的行。

我们要找到iris.csv中所有包含 "vir "的行

grep command

10. history

历史将显示过去命令的日志。我们将输出限制在显示最近的5条命令。

输出

 494  cat iris.csv

 495  wc iris.csv

 496  head -n 5 iris.csv

 497  find . -name "*.dvc" -type f

 498  grep -i "vir" iris.csv

11. zip

zip

是用来压缩文件大小和文件包的工具。zip命令的第一个参数是一个zip文件名,第二个参数是一个文件名或文件名的列表。zip命令主要用于压缩和打包数据集。

$ zip ZipFile.zip File1.txt File2.txt

12. unzip

它对文件和文件夹进行解压缩或解除压缩。只要提供一个`.zip`文件名,它就会解压缩当前目录下的所有文件和文件夹。

$ unzip sampleZipFile.zip

13. cp

它让你复制一个文件、文件列表或目录到目标目录。 cp

命令的第一个参数是一个文件,第二个参数是目标目录路径。

14. mv

cp类似,mv

命令让你把一个文件、文件列表或目录移动到另一个地方。它也用于重命名文件和目录。mv命令的第一个参数是一个文件,第二个参数是目标目录的路径。

15. rm

它从文件系统中删除文件和目录。你可以在 rm

命令后添加一个文件或文件列表的名称。

16.mkdir

它让你一次创建一个由多个目录组成的目录。只要在mkdir

命令后面写上文件夹路径即可。

注意

:用户必须有权限在父目录下创建文件夹。

17. rmdir

你可以通过使用rmdir

删除一个目录或多个目录。只需添加一个文件夹作为第一个参数。

注意:

`-v`标志表示verbose。

输出

VERBOSE: Performing the operation "Remove Directory" on target "C:\love".

18. man

它用于显示Linux系统中任何命令的手册。在我们的例子中,我们将学习echo

命令。

19. diff

它用于显示两个文件之间的逐行差异。只要在diff

命令后面加上两个文件就可以看到比较结果。

输出

31c31
<     solar_irradiation = loaded_model.predict(data)[1]

---

>     solar_irradiation = loaded_model.predict(data)[0]


别名 别名

是一种生产力工具。我已经缩短了你所有冗长和重复的命令。我已经缩短了我所有的Linux和Git命令,以避免在编写同一命令时犯错。

在下面的例子中,每当我运行love

命令时,终端就会显示 "我爱你 "的文字。

$ alias love="echo 'i love you'"

alias command

Abid Ali Awan@1abidaliawan

)是一位认证的数据科学家专家,喜欢建立机器学习模型。目前,他专注于内容创作,撰写关于机器学习和数据科学技术的技术博客。阿比德拥有技术管理的硕士学位和电信工程的学士学位。他的愿景是利用图形神经网络为与精神疾病作斗争的学生建立一个人工智能产品。