EEfaq论坛-赚客自留地

 找回密码
 免费注册
查看: 2067|回复: 12

自己被采集之后才开始思考如何防采集(转贴)

[复制链接]
发表于 2007-10-31 14:18:18 | 显示全部楼层 |阅读模式
老实说,做垃圾站的时候经常采集别人的内容,甚至直接用小偷程序。但当自己辛苦做的本地分类信息网站被别人采集时,心里的滋味还是很不好受的。
如今每一个CMS系统都有采集功能,似乎没有了采集网站就做不下去。既然落到自己头上,总是要解决的。花了1个下午的时间,考虑了几种思路,最终用一个简单易行的方法,暂时解决了这个问题。
解决采集主要是下面3个方法:
1、图片输出。
把重要的数据直接作为图片输出,据说起点小说的vip章节就是这样实现的。这个方法非常彻底,缺点是消耗服务器性能和磁盘空间。
2、动态模板。
采集都是通过制定好饿规则,所以如果让被采集页面没有规则,那么依然可以防采集。可以事先做好N套模板,最终效果都挺相似,但是HTML代码结构却不同。比如有一些用<strong>有一些用<B>,有一些用div,有一些用table。每次显示或者输出时随机调用模板。一旦这样,除了“人肉”,基本上可以防住绝大部分的采集程序。
3、利用客户端状态。
利用客户端状态来防止采集也是一种方法。比如要求网有登录之后才能浏览,判断浏览器是否是IE或者firefox,判断是否在1分钟内浏览了超过20或者30页等 。不过现在比较好的程序都能模拟客户端状态,而且本身对很多大站来说是不切实际的。所以一般在论坛中使用的比较多。
由于我的网站核心信息仅仅是联系方式和发布ip地址。所以最终我采用了第一种,直接输出图片并打上毒命标记。事实证明效果非常好。由于在程序中做了优化,实际运行时对性能的影响微乎其微。可以到(如果认为AD,可以不点击)看看最终页面的效果。玩新后会发现图片的微小变化。
dd.jpg
本文来自: 站长网

[ 本帖最后由 lojofo 于 2007-10-31 14:34 编辑 ]
发表于 2007-10-31 21:40:53 | 显示全部楼层
也就那么一回事儿  :
回复 支持 反对

使用道具 举报

发表于 2007-10-31 21:43:39 | 显示全部楼层
添加IP来源判断,一分钟内玩新超过限制的非搜索引擎IP禁止访问。
回复 支持 反对

使用道具 举报

发表于 2007-10-31 22:00:02 | 显示全部楼层
随机模板防采集 dedecms有~效果还可以~但是对于高手来说~也没用!:
封IP的办法也可以对付!
这些方法只能增加采集的难度~不能完全防止采集
回复 支持 反对

使用道具 举报

发表于 2007-11-2 12:56:08 | 显示全部楼层
第一种如何实现
回复 支持 反对

使用道具 举报

发表于 2007-11-3 13:17:39 | 显示全部楼层
回复 支持 反对

使用道具 举报

发表于 2008-1-9 10:00:51 | 显示全部楼层
最好的是图片输出方式,恩,最好程序实现.
回复 支持 反对

使用道具 举报

发表于 2008-1-9 15:42:09 | 显示全部楼层
动态模板不错的~dede能实现
回复 支持 反对

使用道具 举报

发表于 2008-1-10 17:21:07 | 显示全部楼层
网络建站,你采集他的,他采集你的,一味的防止采集没有意义,留住用户才是根本
回复 支持 反对

使用道具 举报

发表于 2008-2-21 10:58:00 | 显示全部楼层
看技术
回复 支持 反对

使用道具 举报

发表于 2008-11-28 09:39:53 | 显示全部楼层
你说的这放前后切割的采集规则还可以的,正则下没有什么用吧。

只要你放到网上,就不可能防的住采集的。即使是不通的列表文章模板,一样突破!

[ Last edited by 张保仔 at 2008-11-28 09:41 ]
回复 支持 反对

使用道具 举报

发表于 2008-11-28 20:26:07 | 显示全部楼层
当然能防,只要你有心去防御
回复 支持 反对

使用道具 举报

发表于 2009-10-4 21:57:57 | 显示全部楼层
9楼说的对,留住用户才是根本。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

QQ|联系我们|Archiver|手机版|小黑屋|EEfaq论坛

GMT+8, 2024-11-22 09:22

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表