月下博客

一个辅助搜索的浏览器插件

在桌面端使用搜索引擎,最烦心的便是垃圾站点混杂在搜索结果中,一不小心点进去不仅浪费时间和精力,还严重影响心情。不堪垃圾站点搜索结果的烦扰,前段时间开始萌生了开发一个浏览器插件的想法。插件的功能很简单:屏蔽搜索结果中的垃圾站点链接。

垃圾站点分类

垃圾站点有哪些呢?个人认为至少包括以下:

  1. 从外网抓取结果,机器翻译成中文。典型包括“代码日志(codeday.me)”、“程序园(voidcn.com)”、“VoidCC(cn.voidcc.com)”;
  2. 抓取国内站点文章,去除作者信息和原文链接。典型包括“阿里云栖社区(yq.aliyun.com)”和京东子站(www.jd.com/zhishi)。这两个站点背靠巨头还通过这样低劣的手段引流,我是非常鄙视的。好在最近许多类似的站点慢慢在移除文章,或者已经卖站转型;
  3. 用站群/蜘蛛池程序生成的垃圾站点。这些站点存在的主要意义是为黄赌毒网站引流,即使用了伪原创等算法,还是垃圾,浪费用户时间;
  4. 从网上随便摘抄拼凑,以标题吸引人的站点。点进去广告占了一半篇幅,文章内容不痛不痒,帮助甚少。

屏蔽这些垃圾的结果应该是搜索引擎该做的事,但搜索引擎对网页质量的评估模型不尽如人意,导致遇到垃圾站点结果的频率不低。

目前版本功能

这几天没心思干其他的,于是花了两天时间实现了简单能用的1.0版本。目前版本包含以下功能:

  1. 屏蔽或高亮搜索结果。垃圾站点的结果默认屏蔽,高质量站点的结果高亮标出来,提高搜索效率;但目前插件仅支持Google!
  2. 分组管理功能。分组相当于标签功能,可将网址归类到分组里,例如“莆田系”分组存放相关医院站点。同时可禁用/启用分组,批量修改站点行为;
  3. 数据导入和导出功能。支持将本地保存的站点数据导出给他人,也支持导入文件中的站点数据。

其中高亮结果由屏蔽结果启发而来:垃圾结果要屏蔽,优质站点的结果就应该标出来,让人一眼就能识别,搜索更方便。在屏蔽的基础上加了几行代码,顺利完成高亮功能,目前用起来确实感觉效率明显提升。

插件截图:

  1. 屏蔽垃圾站点结果,也可手动点击查看和折叠:

  2. 高亮优质站点的结果:

  3. 添加屏蔽站点或优质站点:

  4. 插件设置页面:

未来计划

目前浏览器扩展仅实现了最基础功能,后续计划包括:

  1. 支持除Google外的其他搜索引擎;
  2. 支持Firefox;
  3. 同步数据到服务端;
  4. 上传到官方市场。

其他

  1. 插件今天刚写好,拓展源码暂未开源,也来不及上传到官方市场。对插件有兴趣的网友可以从这里下载:搜索助手
  2. 本来想支持百度,查看其页面结构后发现链接被加密,暂时放弃了。个人想法是如果支持百度搜索,站点网址加关键字才能达到比较好的效果;
  3. 使用过程中如有问题,请在本页面留言或加本人qq反馈:1020923112。

参考

  1. 一篇文章教你顺利入门和开发chrome扩展程序(插件)