微笑2013 发表于 2014-4-20 20:22:38

hudba 发表于 2014-4-20 19:53 static/image/common/back.gif
楼主加油,过程都是比较辛苦。能放大就好了。数字后面加个0

做一个大站是一样的。

微笑2013 发表于 2014-4-20 20:23:04

Tran 发表于 2014-4-20 20:02 static/image/common/back.gif
就一个站?

恩,一个站。。。。。。。。。。。。。。。。

微笑2013 发表于 2014-4-20 20:23:28

amzgoogle 发表于 2014-4-20 20:07 static/image/common/back.gif
怎么采集到这么多的数据,你真牛。

这都是小问题了。很好解决。

qq402717704 发表于 2014-4-20 20:28:57

微笑2013 发表于 2014-4-20 20:17 static/image/common/back.gif
400多IP

流量太小了,我去年也有一个amazon采集的 收录最高6W,IP最高也有400IP

wolfstyle 发表于 2014-4-20 20:34:27

好牛,我的采集了30w,就卡的不会动了,求亲的服务器配置

RootSir 发表于 2014-4-20 20:39:25

:( 好牛啊 ! :D                              

x10 发表于 2014-4-20 20:55:17

这个收录量,这样的ip太少了吧

wawylysys 发表于 2014-4-20 21:03:47

微笑2013 发表于 2014-4-20 20:21 static/image/common/back.gif
sphinx是一个全文搜索引擎,能从几千万条数据中以几毫秒的速度搜索出相关内容
而且sphinx最新版本已经能 ...

有相关的使用方法教程吗,找了一下都只是说概念,不知道具体应用

foxconndmd 发表于 2014-4-20 21:11:38

微笑2013 发表于 2014-4-20 20:17 static/image/common/back.gif
400多IP

US流量有多少?:Dhttp://www.eefaq.com/static/image/smiley/default/smile.gifhttp://www.eefaq.com/static/image/smiley/default/smile.gifhttp://www.eefaq.com/static/image/smiley/default/smile.gifhttp://www.eefaq.com/static/image/smiley/default/smile.gifhttp://www.eefaq.com/static/image/smiley/default/smile.gif:):)

炫爱炎 发表于 2014-4-20 21:36:44

不是说采集的会被K吗,怎么楼主还可以赚刀刀啊

微笑2013 发表于 2014-4-20 21:54:03

qq402717704 发表于 2014-4-20 20:28 static/image/common/back.gif
流量太小了,我去年也有一个amazon采集的 收录最高6W,IP最高也有400IP

恩,外链做少了。这段时间加一些。

微笑2013 发表于 2014-4-20 21:55:17

wolfstyle 发表于 2014-4-20 20:34 static/image/common/back.gif
好牛,我的采集了30w,就卡的不会动了,求亲的服务器配置

E3-1230 好像是双核   16G内存

微笑2013 发表于 2014-4-20 21:56:38

炫爱炎 发表于 2014-4-20 21:36 static/image/common/back.gif
不是说采集的会被K吗,怎么楼主还可以赚刀刀啊

采集也要看怎么采集,格式化采集与普通采集还是有区别的

qq402717704 发表于 2014-4-20 22:02:14

微笑2013 发表于 2014-4-20 21:56 static/image/common/back.gif
采集也要看怎么采集,格式化采集与普通采集还是有区别的

楼主 能不能普及一下格式化采集的意思!

wolfstyle 发表于 2014-4-20 22:02:28

微笑2013 发表于 2014-4-20 21:56 static/image/common/back.gif
采集也要看怎么采集,格式化采集与普通采集还是有区别的

哦。我是标准采集,带代码了,格式化不会用,都是用的自带的正文提取

zhasyl 发表于 2014-4-20 22:16:19

采集还有这多门道?什么是格式化采集,能不能举个例子!

微笑2013 发表于 2014-4-20 22:17:00

qq402717704 发表于 2014-4-20 22:02 static/image/common/back.gif
楼主 能不能普及一下格式化采集的意思!

普通采集就是你要把内容采集后发布到dedecms
格式化采集就是你要把内容采集后发布到ecshop
dedecms只需要一个title一个content
而ecshop需要title、price、thumb、content等等。
采集信息格式化也是google、百度等搜索引擎正在发展的方向
很明显的例子就是google、百度已经能抓取论坛帖子的发帖时间及回帖人数
做SEO就要走在搜索引擎前面,fuck the rules,and they die!

minlab 发表于 2014-4-20 22:20:36

本帖最后由 minlab 于 2014-4-20 22:22 编辑

其实我最关心的是amazon链接有没隐藏. :loveliness:
1.amazon链接隐藏估计amazon会把你账号k
2.不隐藏链接的话估计google会把你的网站给k了.
.................................................
这个问题基本无解


chenyox 发表于 2014-4-20 22:22:12

现在采集amazon流量不好搞,同样是采集的我1月份搞到7k多刀,现在情况不怎么好,也在改变采集的思路:D

微笑2013 发表于 2014-4-20 22:28:30

minlab 发表于 2014-4-20 22:20 static/image/common/back.gif
其实我最关心的是amazon链接有没隐藏.
1.amazon链接隐藏估计amazon会把你账号k
2.不隐藏链接 ...

没隐藏,直链+nofollw。。

页: 1 [2] 3 4
查看完整版本: 采集了590万amazon,收录220万。