Dedecms建站如何防止文章被随意采集

天外飘仙 2011-03-10 网络 天外飘仙

这几天在忙着用DEDE建站,前前后后忙碌半个多月,网站终于在前几天正式上线。建站之前经常在论坛里逛,听闻过不少网站被采集的实例;虽然说别人采集你的站是欣赏你,只是毕竟采集还是会耗用资源,若对方的站权重比你的高,采集的文章甚至比你的站的文章还要先收录,这样就会导致网站的原创内容迟迟得不到效果。于是乎我上网查看过不少资料,总结出下面几种切实可行的方法,希望对站长朋友们有所帮助。

  一、设置复制文章后在末尾加版权信息

  采集的基本原理就是复制文章,这里可以设置一段代码来实现复制文章后在末尾添加版权信息;这段版权信息不会在文章中显示,只有在文章内容被复制时才会出现在粘贴的内容中。当然,如果采集规则中屏蔽掉这点尾巴,那么版权信息便不会存在。不过对于那些大量采集的人来说,可能不会注意到这个版权尾巴。

  <script language="javascript" type="text/javascript"> 
        <!-- 
        document.body.oncopy = function () { 
        setTimeout( function () { 
        var text = clipboardData.getData("text"); 
        if (text) { 
        text = text + " (这里是你的文章版权信息,去掉括号):"+location.href; 
        clipboardData.setData("text", text); 
        } 
        }, 100 ) 
        } 
        --> 
        </script> 

  这段代码添加到article_article.htm模板之间;具体添加到什么位置可以多测试几次,或者可以查看我的网站的源代码来确认位置。

  二、设置DEDE自带防采集字符串

  DEDE是自带防采集字符串功能的,通过设置防采集字符串,可以让别人采集文章后出现散乱的字符串,这样很影响阅读,从而让采集的网站不得不放弃采集。当然,这并不是万无一失的,所为道高一尺魔高一丈,如果防采集字符串比较少,稍微设置下采集规则便可以替换掉那些无意义的字符串;如果字符串比较多,这对文章的关键词密度会起到稀释作用。另外,少数人建议直接用网站关键字、网站链接作为字符串,据说这样可以增加网站外链,别人采集得越多外链会越多。个人对这样的做法持保留态度,毕竟设置防采集字符串和SEO作弊很相似,弄得不好被搜索引擎K掉那就亏大了。所以,目前很多网站都没有设置这种功能,不知道是不是因为这样的原因。

  三、图片加水印

  如果你的文章中有比较多的图片,那么图片加水印是不错的选择;另外,可以后台设置水印出现的位置随机,这样对方采集到图片后便无法遮盖你的水印。当然,水印最好是透明背景且色彩比较浅,这样才不会影响图片质量。此时此刻对方要么继续为你宣传,要么放弃采集图片,要么放弃采集你的网站,这都是对你有利的。

  四、重要内容设定会员访问限制

  如果你的网站中确实有比较重要的内容要有所保留,固定的资源才能够吸引固定的用户;这样可以通过设置会员访问限制,让注册会员或者高级会员才能够访问这部分内容。当然,这同样会把搜索引擎拒之门外,不过为保持网站的吸引力,适当的稀有资源还是有必要保留的。如果网站没有让用户留下来的资源,那么用户很容易出走的。

  当然,防采集的方法还有很多,大家可以去各大网站上学习、模仿。个人觉得,如果是准备通过原创内容来提高权重的新站,防采集还是有必要的;如果网站已经发展得比较大,好比A5,防采集是没多大必要的,毕竟搜索引擎已经认可这里是文章首发地。

  本文由爱不网(www.aibue.com)首发,转载请注明出处。

责任编辑:天外飘仙