一、字符实体
1.1 如下代码是怎么被解析的呢?解析不出来
`<span><hahaha</span>`
-
如果使用小于号(<),浏览器会将其后的文本解析为一个tag
-
但是某些情况下,确实需要编写一个小于号(<)
-
这个时候就可以使用字符实体
1.2 HTML 实体是一段以连字号(&)开头、以分号(;)结尾的文本(字符串):
-
实体常常用于显示保留字符(这些字符会被解析为 HTML 代码)和不可见的字符(如“不换行空格”)
-
也可以用实体来代替其他难以用标准键盘键入的字符
<span><hehehehe></span>效果:
1.3 常见的字符实体
二、URL
2.1 认识URL
-
URL 代表着是统一资源定位符(Uniform Resource Locator)
-
通俗点说:URL无非就是一个给定的独特资源在 Web 上的地址
- 理论上说,每个有效的 URL 都指向一个唯一的资源
- 这个资源可以是一个 HTML 页面,一个 CSS 文档,一幅图像
2.2 URL的格式
-
URL的标准格式如下:
[协议类型]://[服务器地址]:[端口号]/[文件路径][文件名]?[查询]#[片段ID]
2.3 和URI的区别
-
URI = Uniform Resource Identifier 统一资源标志符,用于标识 Web 技术使用的逻辑或物理资源
-
URL = Uniform Resource Locator 统一资源定位符,俗称网络地址,相当于网络中的门牌号
URI在某一个规则下能把一个资源独一无二的识别出来
-
URL作为一个网络Web资源的地址,可以唯一将一个资源识别出来,所以URL是一个URI
-
URL是URI的一个子集
-
URI并不一定是URL
三、元素语义化
3.1 元素的语义化:用正确的元素做正确的事情。
-
理论上来说,所有的HTML元素,我们都能实现相同的事情
-
标签语义化的好处:
-
方便代码维护
-
减少让开发者之间的沟通成本
-
能让语音合成工具正确识别网页元素的用途,以便作出正确的反应
-
-
有利于SEO
3.2 什么是SEO?
-
搜索引擎优化(英语:search engine optimization,缩写为SEO)是通过了解搜索引擎的运作规则来调整网站,以及提高网站在有关搜索引擎内排名的方式。
-
搜索引擎爬虫原理如下图:
四、认识字符编码
4.1 计算机是干什么的?
-
计算机一开始发明出来时是用来解决数字计算问题的,后来人们发现,计算机还可以做更多的事,例如文本处理
-
计算机只“认识”010110111000…这样由0和1两个数字组成的二进制数字
-
计算机的底层硬件实现就是用电路的开和闭两种状态来表示0和1两个数字的
-
计算机只可以直接存储和处理二进制数字
为了在计算机上也能表示、存储和处理像文字、符号等等之类的字符,就必须将这些字符转换成二进制数字。当然,肯定不是我们想怎么转换就怎么转换,否则就会造成同一段二进制数字在不同计算机上显示出来的字符不一样的情况,因此必须得定一个统一的、标准的转换规则