【AlloyTeam优化系列】Node直出让你的网页秒开

2,552 阅读9分钟

项目: 手Q群成员分布直出

基本概念:

直出其实并不算是新概念。只不过在Web2.0单页应用流行的年代,一直被人遗忘在身后。其实在Web1.0时代,前后端没有分离的时候,程序员直接用后台程序渲染出模板,这便是直出。而到了今天,当Node大大提高了前端开发者的能力时,前端人员也可以做一些后台的事情,通过Node来实现模板的渲染和数据的吞吐。

框架及技术:

由AlloyTeam开发的,建基于Koa之上的玄武直出框架。该框架的优势在于:

(1) 安装与本地开发简单:只需要几行命令安装和几行代码部署本地开发环境。

(2) 完善的文档和规范的开发实践:经过数个项目的试验,文档已经日臻完善,并总结出一套可供大部份业务使用的实践方案。

(3) 部署测试和发布成熟:目前已有兴趣部落、群搜索等数个项目成功发布。

(4) 较好的容错功能: 通过公司的L5负载均衡服务,完美兼容直出与非直出版本,即使直出挂了,也能顺利走非直出版本,让前端可以安心睡大觉。

注:即使不使用这套框架,还是可以利用Koa或者Express这些Node的web框架轻松实现直出的。

直出方案:

1. 数据拉取

玄武框架提供一个封装了开源request库的一个同名request框架,并且提供异步拉取数据方案。文档代码如下:

	
function(req,res,next){

varhander=function(error,response,body){

vardata=JSON.parse(body);

res.body=body;

next();

ajax.request(opt,hander);

也有不少人认为写异步比较不优雅,因此会使用promise, bluebird等第三方库。我在实践手Q群成员分布的时候,经过对generator的学习之后,探索出一个简易的同步写法,这种写法简单易懂,而且大大减少了对第三方库的依赖。如下面代码:

	
function*(req,res){

varopt={

url:'xxxxxxxxx',

method:'POST',

form:{

bkn:getBkn(skey),

gc:gc,

headers:{

'host':'web.qun.qq.com',

'Referer':'web.qun.qq.com'

functionrequestSync(opt){

returnfunction(callback){

ajax.request(opt,function(error,response,body){

callback(error,response);

});

varcontent=yield requestSync(opt);

只要像上面代码一样进行简单的封装,就可以写出同步的写法。具体代码的分析和理解可以看文章的附录一部份。

2. 模板渲染

除了数据拉取,模板如何渲染也是直出的重要环节。下面有三种方案提供:

(1) 在服务器中搭建一个浏览器,渲染好所有东西然后传给前台

这种方案应该是最快的办法,但由于需要在服务器中搭建浏览器进行渲染,因此会消耗服务器大量性能,因此并不可取。

(2) 通过玄武写主要逻辑,然后吐给前台再渲染

这种方案的性能也是非常好的,但由于要将原本代码的部份逻辑放到服务器写,因此需要对后台和前台都做容错,会耗费一些开发时间。

(3)只给前台吐出数据,然后完全由前台渲染

这种方案的改动小,而且容错比较容易实现。例如,我在手Q群成员分布中,在html里加入如下代码:

然后在直出入口文件做替换:

	
this.body=tpl.init().replace('{{\'xw-data\'}}','var xw_data = '+body+';');

然后在js文件里对xw_data做判断,如果有数据,直接去渲染,如果没数据,走旧有逻辑。

BigPipe

1. 实现原理

BigPipe是一个重新设计的动态网页服务体系。 将页面分解成一个个Pagelet,然后通过Web 服务器和浏览器之间建立管道,进行分段输出 (减少请求数)。BigPipe不需要改变现有的网络浏览器或服务器(百度百科)。

查看图片

BigPipe实际上也可以算作出直的一种特殊方案,最选是由Facebook提出(2010 Velocity Conference),在国内由新浪微博最先进行大规模实践(2011 Velocity Conference)。

传统的渲染方式,用户所感知的页面延时如下图,从页面生成,网络延迟到页面渲染都是串行进行的。

查看图片

而BigPipe使得整个用户感知流程变成并行,使页面首屏渲染时间更快。如下图:

查看图片

BigPipe的渲染方式,首先是在页面头部添加一个全局的加载Pagelet的onPageletArrive函数,然后渲染出HTML各Pagelet的占位标签,等各标签的数据到达的时候,依次调用全局onPageletArrive加载函数进行渲染。如以下代码。















从开发模式来说,BigPipe这种的写法比较适合组件化、模块化的前端开发模式。从网站规模来说,对于大型网站的优化效果会比较明显,毕竟分步吐出内容也是会有延时存在的,对于小型网站来说,有可能直接吐出所有内容会比分步吐出更快。

2. 项目实践

了解完基本的原理之后,我们来谈谈BigPipe在手Q群成员分布项目中用Node的具体实践。

(1)  对页面分模块并设计好占位符

首先要对页面尽可能地划分好不同的模块,亦即Pagelet。读过上一篇优化文章的人都记得,手Q群成员分布可以分为活跃群成员、男女比例、省市分布、年龄四大模块,如下面图片红框标框好的部份。

查看图片

查看图片

查看图片

相应地,我们得出如下的占位符。

	




ection>

(2) 设计每个Pagelet需要渲染的内容,并对前后台的代码进行分工

根据Facebook的方式,每个Pagelet都有自己独立需要加载的样式,JS文件,模板文件。这对于小型项目来说,大可不必。如手Q群成员分布项目中,我已直接将样式内联,模板文件也存在变量当中。因此,前端全局渲染函数主要负责将内容嵌入占位符当中。因此在head标签内,我设定了一个componentRender的函数,用于负责将后台吐出的内容嵌入占位符。代码大概如下:


functioncomponentRender(target,tplString){

// targetObj.innerHTML = tplString

而后台的代码,则在拼好模板字符串之后,分步吐出内容,代码大体如下:

this.push("");

this.push("");

this.push("");

this.push("");

对于后台的代码,尤其是使用Koa框架,可能会无从入手,大家可以参考Github上的BigPipe Example。大体的写法和解释如下:

	
// BigPipe需要的模块,用于flush内容到页面

varReadable=require('stream').Readable;

// 生成分片段页面内容函数

varcreateChunkedView=function(end){

   functionnoop(){};

   typeofend==='function'||(end=noop);

   util.inherits(View,Readable);

   functionView(ctx){

       Readable.call(this);

       ctx.type='text/html; charset=utf-8';

       ctx.body=this;

       this.app=ctx;

   View.prototype._read=noop;

   View.prototype.end=end;

   returnView;

function*end(){

// 页面主逻辑,这里也要以用各种yeild

// this.push(xxx)

// this.push(xxx)

// this.push(null) 最末尾请push空内容,通知框架内容flush结束

module.exports=function*(){

// 原本的koa view函数

constView=createChunkedView(end);

   yield*newView(this).end();

3. 成果

首屏时间方面,直出方案比纯前端的方案有大概400ms的优化,提升约28.6%的性能。而BigPipe对比普通直出的优化有大约200ms,提升约16.7%。虽然实践的项目规模较小,模块数量也较少,但BigPipe的优化成果也算是比较令人满意的。

查看图片

页面渲染完成时间方面,纯前端的的优化对比优化前有了质的飞跃(在前一篇文章也提到),性能提升33%。普通直出对纯前端的优化提升约200ms, 性能提升约13.3%。而BigPipe优化跟普通直出优化则没有非常明显的优劣,只快了几十毫秒。

查看图片

纯前端的优化对其实也已经为项目带来比较好的提升。直出对于首屏的渲染也能带来不错的提升。另外,由于玄武框架只是一个简单的页面接入层,并不能直接对数据库进行操作,因此框架方面可以做的事情还有更多。

系列文章里面所介绍到的纯前端优化方案、直出方案,都属于过去数年的方案。随着直出框架、方案及优秀实践的不断完善,相信应该要成为每个项目的标配。

文中略略提到的离线包方案,属于腾讯手Q方面独立研发出来的针对手机端优化的方案,对于其它非腾讯业务也有一定借鉴的意义,具体要参考我导师2014年在InfoQ上有关离线包系统的讲解(链接)。至于未来数年,我们可以将希望寄放在websocket,当然还有即将普及的HTTP2.0身上。

附录一

数据拉取同步方案:

	
function*(req,res){

varopt={

url:'xxxxxxxxx',

method:'POST',

form:{

bkn:getBkn(skey),

gc:gc,

headers:{

'host':'web.qun.qq.com',

'Referer':'web.qun.qq.com'

functionrequestSync(opt){

returnfunction(callback){

ajax.request(opt,function(error,response,body){

callback(error,response);

});

varcontent=yield requestSync(opt);

如何理解?

简单的回调用法:

	
function*Hello(){

 yield1;

 yield2;

varhello=Hello()// hello 是一个generator

vara=hello.next()// a: Object {value: 1, done: false}

varb=hello.next()// b: Object {value: 2, done: false}

varc=hello.next()// c: Object {value: undefined, done: true}

在next中传入参数:

function*gen(){

while(true){

varvalue=yield null;

   console.log(value);

varg=gen();

g.next(1);

// "{ value: null, done: false }"

g.next(2);

// "{ value: null, done: false }"

// 2

// 在该示例中,调用 next 方法并传入了参数,请注意,首次调用 next 方法时没有出任何输出, 这是 因为初始状态时生成器通过yield 返回了null.

经典示例一,按顺序执行:


funciton delay(time,cb){

 setTimeout(function(){

   cb&&cb()

 },time)

delay(200,function(){

 delay(1000,function(){

   delay(500,function(){

     console.log('finish')

functiondelay(time){

 returnfunction(fn){

   setTimeout(function(){

     fn()

   },time)

co(function*(){

 yield delay(200);

 yield delay(1000);

 yield delay(500);

})(function(){

 console.timeEnd(1)// print 1: 1702.000ms

functionco(GenFunc){   // GenFunc → function*() { yield ……….}

 returnfunction(cb){  // function() { console.log.timeEnd(1); }

   vargen=GenFunc()

   next()

   functionnext(){

     if(gen.next){

       varret=gen.next(); 

     // {done: true/false, value=delay 返回的function}

       if(ret.done){// 如果结束就执行cb

         cb&&cb()

       }else{// 继续next

         ret.value(next)

经典示例二,按顺序执行并且下一个执行依赖于上一个执行的返回值:


functiondelay(time){

returnfunction(fn){

   setTimeout(function(){

     fn(time)// time为回调参数

   },time)

co(function*(){

vara;

 a=yield delay(200);// a: 200

 a=yield delay(a+100);// a: 300

 a=yield delay(a+100);// a: 400

   returna;

})(function(data){

 console.log(data)// print 400, 最后的值被回调出来

});

functionco(GenFunc){

returnfunction(cb){

   vargen=GenFunc();

   next();

   functionnext(args){// 传入args

     if(gen.next){

       varret=gen.next(args)// 给next传入args

       if(ret.done){

         cb&&cb(args)

       }else{

         ret.value(next);

回到玄武直出代码:


module.exports=function*(req,res){

co(function*(req,res){

   // some code

functionrequestSync(opt){

returnfunction(callback){

ajax.request(opt,function(error,response,body){

callback(error,response);

});

varcontent=yield requestSync(opt); 

// 在gen.next()之后,yield会返回值给content

// other code

});

参考:

www.alloyteam.com/2015/03/es6…

www.alloyteam.com/2015/04/sol…

www.html-js.com/article/Nod…

系列文章

【AlloyTeam优化系列】构建篇

【AlloyTeam优化系列】纯前端优化首屏时间

【AlloyTeam优化系列】Node直出让你的网页秒开