开发一个用于屏蔽知乎网内容的 Chrome 扩展

1,258 阅读7分钟
原文链接: segmentfault.com

本文原发在我的博客

前段时间电影《疯狂动物城》上映了,然后我的知乎首页就被它刷屏了。虽然我对这部电影没有任何意见,但作为一个还没去电影院看过的人来说,每看到相关问题一次都是无情的剧透,于是我毅然屏蔽了“疯狂动物园”这个话题。本以为问题解决了,但是接下来我又被迫看到这个问题:

问题上添加的五个话题无一命中,我又被剧透了一脸。算了,既然知乎的屏蔽规则靠不住,那就自己动手吧。这样我的Chrome浏览器扩展——ZhihuFilter就诞生了,点击这里查看Github上的项目

扩展功能

其实扩展的功能很简单,当打开知乎首页后,扩展会依次检查你的屏蔽关键词列表是否出现在了某一个答案中,如果出现了,就会把这个答案隐藏,取而代之的是提示信息和一个展开答案的按钮。效果如下图所示:

你可以点击图中的按钮来查看答案,之后可以选择再次隐藏或展开。

当你安装了扩展后,会在地址栏的右侧显示出图标

点击图标后,将会出现设置屏蔽词的界面

你可以在这个页面中设置你想屏蔽的词语。

关于Chrome扩展的开发

关于Chrome扩展开发的内容,可以查看Google的官方文档或者是这个教程

一个应用(扩展)其实是压缩在一起的一组文件,包括HTML,CSS,Javascript脚本,图片文件,还有其它任何需要的文件。

开发扩展的时候,必不可少的是一个manifest.json文件,这是一个配置文件,会告诉Chrome你的扩展中包含了哪些内容。manifest.json中包含扩展的名字、版本及各种资源文件(如图标、显示页面等)的链接。

我的扩展的manifest.json文件

Browser_action 和 page_action

Browser_actionpage_action是扩展的两种类型,它们很相似,主要的区别在于browser_action可以应用于所有的页面,而page_action只能在你设定的几个特定网站内使用。我的扩展是专门用于知乎网站的,因此选择了page_action来处理。

按照Google的文档描述,两者还有一个区别:browser_action的图标显示在地址栏的外部,page_action的图标显示在地址栏内部。但是,在这里的讨论中,似乎新版本的Chrome浏览器中已经将两者都显示在了地址栏的外侧,不过page_action的图标只有在打开特定的网站时才不会显示为灰色。

manifest.json文件中进行如下设置:

"page_action": {
  "default_icon": "images/icon.png",
  "default_title": "知乎屏蔽扩展"
},

background.js

在Manifest中指定background域可以使扩展常驻后台。background可以包含三种属性,分别是scriptspagepersistent

我在扩展中只用到了scripts

"background": {
  "scripts": ["js/jquery-2.2.1.js","js/background.js"]
},

这样就会自动生成一个包含了列出的脚本文件的后台页面。

在我的background.js文件中有如下内容:

    // 当网址改变的时候,判断当前的页面是否是知乎
    // 如果是的话,就显示出图标,并设置它的弹出页面
    chrome.tabs.onUpdated.addListener(function(id, info, tab){
        if (tab.url.toLowerCase().indexOf("zhihu.com") > -1){
            chrome.pageAction.show(id);
            chrome.pageAction.setPopup({
                tabId: id,
                popup: 'popup.html'
            });
        }
    });

background.js文件中还有一个用于和content_script进行通信的监听器。

参考资料:
Google的Backgorund Pages文档
另一个教程

Content Scripts

Content scripts是在Web页面内运行的javascript脚本。通过使用标准的DOM,它们可以获取浏览器所访问页面的详细信息,并可以修改这些信息。

manifest.json文件中进行设置:

"content_scripts": [
{
  "matches": ["*://*.zhihu.com/*"],
  "js": ["js/jquery-2.2.1.js", "js/content_script.js"]
}

在打开匹配的网站时,列出的js文件会被注入页面,这样就可以获得浏览器所访问的web页面的详细信息,并可以对页面做出修改。虽然content script和页面共享了DOM结构,但不能访问该页面或其它content script中定义的函数和变量,这样就避免了相同的函数或变量名称的干扰。

我的扩展的主要功能就是在content_script.js中完成的,在该脚本中通过对页面的DOM进行操作来实现功能。

扩展功能的实现

对知乎首页进行分析

查看一下知乎首页的源代码,所有的答案内容是放在一个id=js-home-feed-list的div中的,结构大致如下:

    
    

而在答案部分中,又分为摘要和完整的答案。

    
</div> <!--包括了全部答案内容但不显示--> <div class="zh-summary summary clearfix"></div> <!--显示摘要--> </div> </div></code></pre> <p>我们可以获取上面的节点内容,来确定是否需要屏蔽这个答案。最简单的实现方法就是查找关键词是否在节点的<code>outerHTML</code>中出现,如果出现了就给<code>.feed-main</code>加上一个名为<code>hidden</code>的class。</p> <h3>用于替换的内容</h3> <p>原来的答案被隐藏了之后,需要在这个地方换上点新的内容,我在这里创建了一个div,内部有一个p元素用于显示信息,及一个button用于切换答案的状态。</p> <pre><code> // 创建用于替换的div var $div = $('<div class="block-info"></div>'); $div.append($('<p>这里有一个被屏蔽的答案<span></span></p>')); $div.append($('<button class="block-btn">手贱一下</button>'));</code></pre> <p>还需要在按钮上绑定点击事件,p元素内显示的信息也会根据实际进行修改。</p> <h3>关键词的存储</h3> <p>在我的扩展中,我是将需要屏蔽的关键词存放在了<code>localStorage</code>中。关键词保存在localStorage中的<code>keywords</code>键下,是一个简单的由逗号分隔开的字符串。</p> <blockquote><p>要访问同一个localStorage对象,页面必须来自同一个域名(子域名无效),使用同一种协议,在同一个端口上。</p></blockquote> <p>由于content script注入到了知乎页面,而localStorage存放在扩展的域下,要在content script中获得关键词的值,就必须用到页面中的通信。</p> <p>Chrome提供了4个有关扩展页面间相互通信的接口,分别是<code>runtime.sendMessage</code>、<code>runtime.onMessage</code>、<code>runtime.connect</code>和<code>runtime.onConnect</code>,<br>这里用到了前两个。</p> <p>content_script.js</p> <pre><code> // 从扩展的localStorage中获得存储的关键词 chrome.runtime.sendMessage({method: "getKeywords"}, function (response) { str = response.keywords; keywords = str !== '' ? str.split(',') : []; });</code></pre> <p>对应的background.js</p> <pre><code> chrome.runtime.onMessage.addListener(function(request, sender, sendResponse) { if (request.method == "getKeywords") sendResponse({keywords: localStorage['keywords']}); else sendResponse({}); });</code></pre> <p>这样就可以在content script中使用localStorage的值了。</p> <blockquote><p>参考资料:<a href="http://www.ituring.com.cn/article/60272">扩展页面中的通信</a></p></blockquote> <h3>检测页面加载了更多内容</h3> <p>每当当知乎页面加载了更多的答案时,我们需要再进行处理。那么如何检测页面中加载了更多内容,这里需要用到<code>MutationObserver</code>对象。<code>MutationObserver</code>提供了检测页面中的DOM变化的方法。</p> <p><code>MutationObserver</code>的使用方法:</p> <p>首先,创建一个mutationObserver的实例</p> <pre><code>var observer = new MutationObserver(callback) </code></pre> <p>这里需要一个回调函数作为构造器的参数。</p> <p>callback函数接受一个参数,所有被记录到的DOM变化将会组合成一个数组,作为参数传给回调函数进行处理。</p> <p>mutationObserver对象有几个方法,这里只用到observe方法。</p> <p>observe方法接收两个参数:</p> <pre><code> void observe( Node target, MutationObserverInit options );</code></pre> <p>第一个参数指的是你要观察哪一个节点的DOM变化。第二个参数是一个选项参数,</p> <pre><code> var option = { 'childList': true, // 观察子元素 'subtree': true, // 观察目标节点的后代元素 'attributes': false // 不观察目标节点属性的变化 };</code></pre> <p>这里只设置了三个选项,其余属性可以看<a href="https://developer.mozilla.org/en-US/docs/Web/API/MutationObserver#MutationObserverInit">MDN文档</a>。</p> <p>观察到的每一个变化都是一个MutationRecord对象,它有许多属性,比如:</p> <ul> <li><p>type,记录变化的类型</p></li> <li><p>addedNodes,由增加的节点组成的NodeList</p></li> <li><p>removeNodes,由删除的节点组成的NodeList</p></li> </ul> <p>因为addedNodes是一个NodeList,所以可以在它上面应用jQuery的$(), <code>$(mutation.addedNodes)</code>。</p> <p>其它的属性可以见<a href="https://developer.mozilla.org/en-US/docs/Web/API/MutationRecord">MDN文档</a>。</p> <p>所有的MutationRecord会被放进一个list中,作为参数传给上面的callback函数。通过对MutationRecord对象的属性进行检测,如果新增的节点里出现了<code>class=feed-main</code>的元素,则代表加载了新的答案,需要再一次运行程序。</p> <blockquote><p>参考资料:<br><a href="https://dev.opera.com/articles/mutation-observers-tutorial/">Getting to Know Mutation Observers</a><br><a href="http://javascript.ruanyifeng.com/dom/mutationobserver.html">Mutation Observer</a></p></blockquote> <h2>扩展的使用</h2> <p>在我的设想中,扩展可以提供一些选项,比如正则表达式的支持,再比如除了首页外,在答案页面是否也需要提供屏蔽功能。这些选项会在之后逐步加入。</p> <p>由于Chrome的设置,不能够安装Web Store中没有的程序。而发布扩展需要先付$5,我没有信用卡,也就暂时没有发布扩展。如果想尝试一下扩展的话,可以直接下载<a href="https://github.com/noiron/ZhihuFilter">Github中的代码</a>到本地。在Chrome浏览器的菜单中选择 More tools -> Extensions,进入扩展页面后,勾选右上角的Developer mode,选择Load unpacked extension,选择扩展文件夹即可。 </p> <p>欢迎使用后提出建议。</p> </div> </div>