浏览器同源策略

768 阅读8分钟

读完本节内容,你可以学到:

  1. 同源策略产生的原因和作用;
  2. 跨域的多种解决方案;

前言

我们可以设想这样一个场景:

学校开放了一个窗口给家长,让家长可以通过窗口询问孩子的成绩。班级里面的每个学生都是互不相关、互不影响的个体,每个学生和家长都来自同一个家庭。当同一个家庭里面的家长询问孩子的成绩,窗口就会给出相应的数据。如果不同家庭的家长来询问其他学生的成绩,窗口都给出应答,这样孩子成绩的安全性就没法得到保证。这样不就乱套了吗?

如果没有同源策略

首先让我们来看看上面例子中的窗口、家庭、家长、学生在web世界中的对应关系:

这个窗口就是浏览器的窗口,里面的家长和学生就是一个个独立的网站,而来自同个家庭的成员(家长、学生)就是同域

如果Web世界没有安全策略,那么我们的网站可以加载并执行别人任意的文件,这样的情况将会出现很多不可控的问题。

比如打开一个银行站点,然后又不小心打开了一个恶意站点,如果没有安全措施,恶意站点就可以做很多事情:

  • 修改银行站点的DOM、CSSOM等信息;
  • 在银行站点内插入恶意JavaScript脚本;
  • 劫持用户登录的用户名和密码;
  • 读取用户的Cookie、IndexDB等数据;
  • ...

同源策略

那么如何保证只有同一个家庭里的家长才能查询学生的成绩呢?对应Web世界里,如何保证网页只能被同一个域中的代码查询、修改呢?

这就有了我们今天的主角:同源策略(Same-origin policy)

同源策略是一种约定,它是浏览器最核心也最基本的安全功能 ... 可以说Web是构建在同源策略的基础之上的,浏览器只是针对同源策略的一种实现。

来自《白帽子讲Web安全》

什么是同源

如果两个URL是协议(protocol)、端口(port)、域名(host)都相同的话,那么这两个URL就是同源的。

下表给出了与URLhttp://store.company.com/dir/page.html的源进行对比的示例:

URL结果原因
http://store.company.com/dir2/other.html同源只是路径不同
http://store.company.com/dir/inner/another.html同源只是路径不同
https://store.company.com/secure.html不同源协议不同
http://store.company.com:81/dir/etc.html不同源端口不同 ( http:// 默认端口是80)
http://news.company.com/dir/other.html不同源主机不同

同源策略的作用

从上面的例子我们知道,同源策略的作用就是限制来自另一个域的资源交互,从而保障我们网站的隐私和数据的安全

同源策略的表现

具体来讲,同源策略主要表现在DOM、Web数据、网络数据三个层面:

DOM层面。同源策略限制了来自不同源的JavaScript脚本对当前页面的DOM对象进行读写操作,从而防止跨域脚本篡改DOM结构。

Web数据层面。同源策略限制不同源的站点读取当前站点的Cookie、LocalStorage和IndexDB等数据,从而保障数据的安全性。

网络层面。同源策略限制了通过 XMLHttpRequest 等方式将站点的数据发送给不同源的站点。

安全性和可用性的权衡

浏览器在安全性可用性之间做了取舍。众所周知,对于小项目而言,我们可以把所有资源都放在自有服务器上面。但是对于中等乃至大型项目而言,由于服务器的价格昂贵,我们项目的静态资源文件如:图片、视频等,需要托管在第三方来削减运营成本,所以浏览器在遵循安全性的基础上,放宽了限制,允许imgscriptstyle标签进行跨域引用资源。

跨域的解决方案

jsonp

通过向网页添加一个<script>标签,向服务器请求 JSON 数据,请求到数据后,将数据放在一个指定名字的回调函数的参数位置传回来。

原生实现:

let scriptElement = document.createElement('script')
scriptElement.type = 'text/javascript'

// 传参一个回调函数名给后端,方便后端返回时执行这个回调函数
scriptElement.src = 'http://www.domain2.com:8080/login?user=admin&callback=handleCallback'
document.head.appendChild(scriptElement)

// 执行回调函数
function handleCallback(res) {
    console.warn(JSON.stringify(res));
}

服务端返回如下(返回时执行全局函数):

handleCallback({status: true, user: 'admin'})

Jquery ajax:

$.ajax({
    url: 'http://www.domain2.com:8080/login',
    type: 'get',
    dataType: 'jsonp', // 请求方式为jsonp
    jsonpCallback: 'handleCallback', // 自定义回调函数
    data: {},
})

后端Node.js代码示例:

var querystring = require('querystring')
var http = require('http')
var server = http.createServer()

server.on('request', function(req, res) {
    var params = qs.parse(req.url.splite('?')[1])
    var fn = params.callback;

    // jsonp返回设置
    res.writeHead(200, { 'Content-type': 'text/javascript' })
    res.write(fn + '(' + JSON.stringify(params) + ')')
    res.end()
})

server.listen('8080')
console.log('Server is running at port 8080...')

jsonp 的缺点:只能实现 get 请求。

location.hash + iframe

location.hash 方式跨域,是子框架具有修改父框架 srchash 值,通过这个属性进行传递数据,且更改 hash 值,页面不会刷新,但是传递的数据的字节数是有限的。

页面 a.hmtl 的代码:

<iframe src="b.html" id="myIframe" onload="test()"></iframe>
<script>
    // iframe载入b.html页面后会执行该函数
    function test() {
        // 获取用过b.html页面设置的hash值
        var data = window.location.hash;
        console.log(data);
    }
</script>

页面 b.html 的代码:

<script type="text/javascript">
    // 设置父页面的 hash 值
    parent.location.hash = "Hello World!"
</script>

location.hash 的缺点:无法应对复杂的功能场景。

window.name + iframe

window 对象有一个 name 属性,该属性有个特征:即在一个窗口的生命周期内都是共享一个 window.name 的,每个页面对 window.name 都有读写的权限,window.anme 是持久存在一个窗口过的所有页面中的,并不会因为新页面的载人而进行重置。

页面 a.html 的代码:

<iframe src="http://laixiangran.cn/b.html" id="myIframe" onload="test()" style="display: none;">
<script>
    // 2. iframe载入 "http://laixiangran.cn/b.html 页面后会执行该函数
    function test() {
        var iframe = document.getElementById('myIframe');
        
        // 重置 iframe 的 onload 事件程序,
        // 此时经过后面代码重置 src 之后,
        // http://www.laixiangran.cn/a.html 页面与该 iframe 在同一个源了,可以相互访问了
        iframe.onload = function() {
            var data = iframe.contentWindow.name; // 4. 获取 iframe 里的 window.name
            console.log(data); // hello world!
        };
        
        // 3. 重置一个与 http://www.laixiangran.cn/a.html 页面同源的页面
        iframe.src = 'http://www.laixiangran.cn/c.html';
    }
</script>

页面 b.html 的代码:

<script type="text/javascript">
    // 给当前的 window.name 设置内容
    window.name = "Hello World!";
</script>

window.name + iframe 的缺点是:无法应对复杂的功能场景。

postMessage

window.postMessage(message, targetOrigin) 方法是 HTML5 新引进的特性,可以使用它来向其他的 window 对象发送消息,无论这个 window 对象是属于同源或者不同源。

调用 postMessage 方法的 window 对象是指要接收消息的那个 window 对象,该方法的第一个参数 message 为要发送的消息,类型只能为字符串;第二个参数 targetOrigin 用来限定接收消息的那个 window 对象所在的域,如果不想限定域,可以使用通配符 *

需要接收消息的 window 对象,可是通过监听自身的 message 事件来获取传递的消息,消息内容存储在该事件对象的 data 属性中。

页面 a.html 的代码:

<iframe src="http://laixiangran.cn/b.html" id="myIframe" onload="test()" style="display: none;">
<script>
    // 1. iframe载入 "http://laixiangran.cn/b.html 页面后会执行该函数
    function test() {
        // 2. 获取 http://laixiangran.cn/b.html 页面的 window 对象,
        // 然后通过 postMessage 向 http://laixiangran.cn/b.html 页面发送消息
        var iframe = document.getElementById('myIframe');
        var win = iframe.contentWindow;
        win.postMessage('我是来自 http://www.laixiangran.cn/a.html 页面的消息', '*');
    }
</script>

页面 b.html 的代码:

<script type="text/javascript">
    // 注册 message 事件用来接收消息
    window.onmessage = function(e) {
        e = e || event; // 获取事件对象
        console.log(e.data); // 通过 data 属性得到发送来的消息
    }
</script>

跨域资源共享(CORS)

CORS(Cross-origin resource sharing,跨域资源共享)是W3C标准,定义了在必须访问跨域资源时,浏览器与服务器应该怎样通信。CORS背后的基本思想,就是使用自定义的HTTP头部让浏览器跟服务器沟通,从而决定请求或响应是应该成功,还是应该失败。

整个CORS通信过程,都是浏览器自动完成,不需要用户参与。对于开发者来说,CORS通信和同源的ajax通信没有区别,代码完全一样。浏览器一旦发现ajax请求跨源,就会自动添加一些附加的头部信息,有时还会多出现一次附加的请求,但是用户不会察觉。

因此,实现CORS通信的关键是服务器,只要服务器实现了CORS接口,就可以跨源通信。

浏览器将CORS请求分成两类:简单请求和非简单请求;

只要同时满足以下两大条件,就属于简单请求: - 请求方法是以下三种方法之一: HEADGETPOST - HTTP的头信息不超出以下几种字段: AcceptAccept-LanguageContent-LanguageLast-Event-IDContent-Type

凡是不同时满足上面两个条件,就属于非简单请求。

浏览器对这两种请求的处理,是不一样的:

简单请求

在请求中需要额外添加一个 Origin 的头部,其中包含请求页面的源信息(协议、域名和端口),以便服务器根据这个头部信息来决定是否给予响应。例如:Origin: http://www.laixiangran.cn

如果服务器认为这个请求可以接受,就在Access-Control-Allow-Origin头部中回发相同的源信息(如果是公共资源,可以回发*)。例如:Access-Control-Allow-Origin: http://www.laixiangran.cn

没有这个头部或者有这个头部但是源信息不匹配,浏览器就会驳回请求。正常请求下,浏览器会处理请求。注意,请求和响应都不包含cookie信息。

如果需要包含cookie信息,ajax请求需要设置xhr的属性withCredentialstrue,服务器需要设置响应头部Access-Control-Allow-Credentials: true

非简单请求

浏览器在发送真正的请求之前,会先发送一个 Preflight 请求给服务器,这种请求使用 OPTIONS 方法,发送下列头部:

  • Origin: 与简单的请求相同;
  • Access-Control-Request-Method: 请求自身使用的方法;
  • Access-Control-Request-Headers: (可选)自定义的头部信息,多个头部信息以逗号分隔;
Origin: http://www.laixiangran.com
Access-Control-Request-Method: POST
Access-Control-Request-Headers: NCZ

发送这个请求后,服务器可以决定是否允许这种类型的请求。服务器通过在响应中发送如下头部与浏览器进行沟通:

  • Access-Control-Allow-Origin:与简单的请求相同。
  • Access-Control-Allow-Methods: 允许的方法,多个方法以逗号分隔。
  • Access-Control-Allow-Headers: 允许的头部,多个方法以逗号分隔。
  • Access-Control-Max-Age: 应该将这个 Preflight 请求缓存多长时间(以秒表示)。
Access-Control-Allow-Origin: http://www.laixiangran.cn
Access-Control-Allow-Methods: GET, POST
Access-Control-Allow-Headers: NCZ
Access-Control-Max-Age: 1728000

一旦服务器通过 Preflight 请求允许该请求之后,以后每次浏览器正常的 CORS 请求,就都跟简单请求一样了。

优点
  • CORS 通信与同源的 AJAX 通信没有差别,代码完全一样,容易维护;
  • 支持所有类型的 HTTP 请求;
缺点
  • 存在兼容性问题,特别是 IE10 以下的浏览器;
  • 第一次发送非简单请求时会多一次请求。

WebSocket 协议

WebSocket protocol 是 HTML5 一种新的协议,它实现了浏览器跟服务器全双工通信,同时允许跨域通讯,是 server push 技术的一种实现。

前端代码:

<div>user input:<input type="text"></div>
<script src="https://cdn.bootcss.com/socket.io/2.2.0/socket.io.js"></script>
<script>
var socket = io('http://www.domain2.com:8080');

// 连接成功处理
socket.on('connect', function() {
    // 监听服务端消息
    socket.on('message', function(msg) {
        console.log('data from server: ---> ' + msg); 
    });

    // 监听服务端关闭
    socket.on('disconnect', function() { 
        console.log('Server socket has closed.'); 
    });
});

document.getElementsByTagName('input')[0].onblur = function() {
    socket.send(this.value);
};
</script>

Node.js socket 后台:

var http = require('http')
var socket = require('socket.io')

// 启动HTTP服务
var server = http.createServer(function(req, res) {
    res.writeHead(200, { 'Content-type': 'text/html' })
    res.end()
})

server.listen(8080)

// 监听 socket 连接
socket.listen(server).on('connection', function(client) {
    // 接收信息
    client.on('message', function(msg) {
        client.send('Hello:' + msg)
        console.log('data from client: ---> ' + msg)
    })

    // 断开处理
    client.on('disconnect', function() {
        console.log('Client socket has closed.')
    })
})

参考资料

1. 安全攻防技能30讲

time.geekbang.org/column/intr…

2. Web协议详解与抓包实战

time.geekbang.org/course/intr…

3. 多种跨域方案详解

www.bilibili.com/video/BV1SE…

4. 浏览器的同源策略

developer.mozilla.org/zh-CN/docs/…