Python爬虫入门基础学习(一)

803 阅读4分钟
  • 本文已参与「新人创作礼」活动,一起开启掘金创作之路。

大家好,我是卷心菜。因为项目的需要,最近在学习Python的爬虫。这一篇是关于Python的基础知识点,也是学习爬虫的入门知识点!如果您看完文章有所收获,可以三连支持博主哦~,嘻嘻。


一、前言

  • 自己会在暑假期间学习完Python爬虫的视频,从入门到项目实战,一步一个脚印,并会持续更新Python爬虫专栏。欢迎感兴趣的小伙伴和自己一起讨论相关的知识,对于文章错误的地方,欢迎指正!

二、注释

  • 在我们的编码过程中,因为时间久、遗忘快、代码逻辑复杂等原因,我们可以适当的添加注释,来帮助自己和其他编码人员的解读。因此,学习Python的注释是非常有必要的,我们应当养成编写注释的代码习惯!

  • 和大多数编程语言一样,Python有两种注释:单行注释多行注释

  • 单行注释:以#开头,#右边的所有东西当做说明,而不是真正要执行的程序,起辅助说明作用。

  • 多行注释:以 '''开始,并以 ''' 结束,称之为多行注释。

# 单行注释,解释代码
print('我要过科目一')

'''
多行注释
不要慌,不要慌,太阳下了有月光。
'''

三、变量

  • 基本语法:变量名 = 变量值
  • 变量是用来存储数据的,可以修改变量的值
question = "你喜欢什么歌?"
message = "晴天"
img = "https://item.jd.com/10046693874903.html"
print(question)
print(message)
print(img)

运行结果:

在这里插入图片描述

四、标志符

  • 计算机编程语言中,标识符是用户编程时使用的名字,用于给变量、常量、函数、语句块等命名
  • 标识符由字母、下划线和数字组成,且数字不能开头
  • 严格区分大小写
  • 不能使用关键字

下图中画X的就是标志符不规范的举例:

在这里插入图片描述

五、关键字

  • 在讲标志符时,我们讲到了不能使用关键字,那么Python中有哪些关键字呢?让我们来看一看:
FalseNonefrom
Trueandglobal
asassertif
breakclassimport
continuedefin
delelifis
elseexceptlambda
finallyfornonlocal
notorpass
raisereturntry
whilewithyield

六、基本数据类型

  • 因为是学习爬虫,所以就学习我们需要的数据类型,先来简单介绍一下Python有哪些数据类型,并简单认识它们的基本语法。

在这里插入图片描述

1、Number数值型

# Number 数值类型
# int
money = 20
# float
value = 20.5

2、布尔型

# boolean 布尔类型
gender = True
sex = False

3、字符串型

# string 字符串
message = '我是字符串'
information = '串'
# 嵌套使用
print("'我是单引号'")
print('"我是双引号"')

运行结果:

在这里插入图片描述 需要注意的是,在有需要时,单引号和双引号可以嵌套使用~

七、高级数据类型

  • 就像前面所说的,这篇就先简单介绍语法的基本使用,对于深入的学习,在后面文章中会详细介绍

1、列表

# 应用场景:当爬取到多个数据的时候,可以把这些数据存储到列表中
book_list = ['爱的教育', '西游记', '三国演义']
object_list = ['斗破苍穹', 123, 3.5, True]

print(book_list)
print(object_list)

运行结果:

在这里插入图片描述

2、元组

age_tuple = (18, 19, 20, 21)
print(age_tuple)

运行结果:

在这里插入图片描述

3、字典

person = {
    'name': '我是一棵卷心菜',
    'age': 21,
    'major': '计算机科学与技术'
}
print(person)

在这里插入图片描述

八、查看数据类型

  • 在Python中,只要定义了一个变量,而且它有数据,那么它的类型就已经确定了,系统会自动辨别。也就是说在使用的时候 "变量没有类型,数据才有类型"
  • 如果临时想要查看一个变量存储的数据类型,可以使用type(变量名),来查看变量存储的数据类型
age = 21
print(type(age))  # int

name = '我是一棵卷心菜'
print(type(name))  # string

score = 98.5
print(type(score))  # float

gender = True
print(type(gender)) # boolean

list_type = ['hello', 'world']
print(type(list_type)) # list列表

tuple_type = (12, 13, 14,)
print(type(tuple_type)) # tuple元组

dict_type = {'name': '卷心菜', 'age': 21}
print(type(dict_type)) # dict字典

感谢阅读,一起进步,嘻嘻~