|
最近研究了下WordPress的RSS采集,但是我几乎看了所有的插件,都有各种各样的问题。
下面我把我研究的几个WP的RSS采集插件简述一下:
jay_smart_rss
http://www.jaylee.cn/jay_smart_rss/
这个作者2006年就不更新了,只能用于WP2.2以下的版本,当时还是很不错的,可惜新版的WP用不起了。我曾试图修改这个插件,但发现他写的太乱了,改的话几乎就是100%,还有他那个rss解析部分写的来我都看不懂。
FwArtsAutoIn [风度自动文章采集发布插件]
http://www.flywud.com/wp-content/fwautoinhelp/
这个使用教程很详细,而且我发现他还比较新,几个月前的东西。但是看他教程的常见问题,就知道要是虚拟主机,各种虚拟主机给PHP开的权限和插件不一样,只有配置较好的,才能用的顺畅。我下载试了一下,居然采集了没反应,好像对windows主机的php主机环境没反应,懒的去研究代码了,而且我想到php的采集能力还是比较弱的。
SMART_RSS
这个插件是老外的,我都没有下到。听说很多虚拟主机不兼容,同样是PHP环境要配置的相当好才行。
火车头采集
好像有wordpress的采集模块,但是我不会用火车头,也不知道采集RSS难不难。但我想新手用起来肯定不是那么容易的。
写个软件版的‘WordPressRSS采集助手’+PHP版的采集插件
功能比较简单,远比不上火车头,但是专一,且使用简单,就是采集各种RSS到WordPress
最重要是新手用起来简单无比
此软件和插件共花时间2个晚上(我晚上才工作)
介绍下它的功能:
WordPressRSS采集助手,负责采集RSS工作,它比PHP采集要快和强,使用多线程,不超过5个
WordPressRSS采集助手将采集到的数据通过桥连接的方式发送到PHP的插件页面,由插件负责保存到数据库的工作。
数据直接入库,中间不经过任何wordpress的自带环节,就是说只要有数据库表,没安装wordpress都可以采集入库。
软件已自带文章去重复功能,重复的文章是会自己避开的。
介绍它的使用方法:
添加一个RSS链接就不说了,关键是RSS的节点配置
比如一个RSS文本如下
- - <rss version="2.0">
- - <channel>
- - <item>
- <title>外形很唬人 "啤酒瓶"造型电话现身</title>
- <span>http://news.dayoo.com/photo/200810/15/54034_4282360.htm</span>
- <guid>http://news.dayoo.com/photo/200810/15/54034_4282360.htm</guid>
- <pubDate>Wed, 15 Oct 2008 11:00:05 GMT</pubDate>
- - <description>
- - <![CDATA[ 内容]]>
- </description>
- </item>
- </channel>
- </rss>
复制代码
标题路径:就是wordpress发贴时的标题,你想想,你是不是应该把上面RSS中,路径 rss/channel/item/title 作为标题路径呢。
文章内容路径:就是wordpress发贴时的标题对应的内容,路径应该是 rss/channel/item/description
这里不要想复杂了,其实异常的简单,就是标签的绝对路径,只要你找准了,就能正确解析RSS。
这里可比火车头的采集规则简单得多。
其他也没有好说的了,要注意的是,采集的时候,一个链接采集了一次要隔一段时间再去采集,太频繁了会被封一会。
说下为什么没有做全自动的每天自动采集:
1.因为我本人不提倡和不喜欢采集
2.RSS更新很慢,每天手工点一下,这样也有助于你收录,因为搜索引擎不喜欢大量的搜录,如果你每天或隔几天才多出少许的新文章,这样的站搜索引擎才不会认为你再采集。
3.这个软件第一版我看下反响,再考虑以后的版本功能,要是反应不好我就不做了。
4.假如有超强的全功能版本,我会收取少量费用,第一版就免费了,功能还是蛮不错的。
软件的安装:
1.上传 月光RSS采集插件 hyrinlight_gather_rss.php 到你的wordpress插件目录
2.打开助手,添加插件准确位置,保存。
3.添加新的RSS链接,并设置采集节点。
4.开始采集并检查结果。
最后附截图 |
评分
-
查看全部评分
|