EEfaq论坛-赚客自留地

 找回密码
 免费注册
楼主: 微笑2013

采集了590万amazon,收录220万。

  [复制链接]
 楼主| 发表于 2014-4-20 20:22:38 | 显示全部楼层
回复 支持 反对

使用道具 举报

 楼主| 发表于 2014-4-20 20:23:04 | 显示全部楼层

恩,一个站。。。。。。。。。。。。。。。。

回复 支持 反对

使用道具 举报

 楼主| 发表于 2014-4-20 20:23:28 | 显示全部楼层
amzgoogle 发表于 2014-4-20 20:07
怎么采集到这么多的数据,你真牛。

这都是小问题了。很好解决。

回复 支持 反对

使用道具 举报

发表于 2014-4-20 20:28:57 | 显示全部楼层

流量太小了,我去年也有一个amazon采集的 收录最高6W,IP最高也有400IP

回复 支持 反对

使用道具 举报

发表于 2014-4-20 20:34:27 | 显示全部楼层
好牛,我的采集了30w,就卡的不会动了,求亲的服务器配置
回复 支持 反对

使用道具 举报

发表于 2014-4-20 20:39:25 | 显示全部楼层
好牛啊 !                               
回复 支持 反对

使用道具 举报

发表于 2014-4-20 20:55:17 | 显示全部楼层
这个收录量,这样的ip太少了吧
回复 支持 反对

使用道具 举报

发表于 2014-4-20 21:03:47 | 显示全部楼层
微笑2013 发表于 2014-4-20 20:21
sphinx是一个全文搜索引擎,能从几千万条数据中以几毫秒的速度搜索出相关内容
而且sphinx最新版本已经能 ...

有相关的使用方法教程吗,找了一下都只是说概念,不知道具体应用

回复 支持 反对

使用道具 举报

发表于 2014-4-20 21:11:38 | 显示全部楼层

US流量有多少?

                               
登录/注册后可看大图

                               
登录/注册后可看大图

                               
登录/注册后可看大图

                               
登录/注册后可看大图

                               
登录/注册后可看大图


回复 支持 反对

使用道具 举报

发表于 2014-4-20 21:36:44 | 显示全部楼层
不是说采集的会被K吗,怎么楼主还可以赚刀刀啊
回复 支持 反对

使用道具 举报

 楼主| 发表于 2014-4-20 21:54:03 | 显示全部楼层
qq402717704 发表于 2014-4-20 20:28
流量太小了,我去年也有一个amazon采集的 收录最高6W,IP最高也有400IP

恩,外链做少了。这段时间加一些。

回复 支持 反对

使用道具 举报

 楼主| 发表于 2014-4-20 21:55:17 | 显示全部楼层
wolfstyle 发表于 2014-4-20 20:34
好牛,我的采集了30w,就卡的不会动了,求亲的服务器配置

E3-1230 好像是双核   16G内存

点评

e3 1230应该是4核的吧, 服务器一般都用这个CPU  发表于 2014-4-22 10:55
回复 支持 反对

使用道具 举报

 楼主| 发表于 2014-4-20 21:56:38 | 显示全部楼层
炫爱炎 发表于 2014-4-20 21:36
不是说采集的会被K吗,怎么楼主还可以赚刀刀啊

采集也要看怎么采集,格式化采集与普通采集还是有区别的

回复 支持 反对

使用道具 举报

发表于 2014-4-20 22:02:14 | 显示全部楼层
微笑2013 发表于 2014-4-20 21:56
采集也要看怎么采集,格式化采集与普通采集还是有区别的

楼主 能不能普及一下格式化采集的意思!

回复 支持 反对

使用道具 举报

发表于 2014-4-20 22:02:28 | 显示全部楼层
微笑2013 发表于 2014-4-20 21:56
采集也要看怎么采集,格式化采集与普通采集还是有区别的

哦。我是标准采集,带代码了,格式化不会用,都是用的自带的正文提取

回复 支持 反对

使用道具 举报

发表于 2014-4-20 22:16:19 | 显示全部楼层
采集还有这多门道?什么是格式化采集,能不能举个例子!
回复 支持 反对

使用道具 举报

 楼主| 发表于 2014-4-20 22:17:00 | 显示全部楼层
qq402717704 发表于 2014-4-20 22:02
楼主 能不能普及一下格式化采集的意思!

普通采集就是你要把内容采集后发布到dedecms
格式化采集就是你要把内容采集后发布到ecshop
dedecms只需要一个title一个content
而ecshop需要title、price、thumb、content等等。
采集信息格式化也是google、百度等搜索引擎正在发展的方向
很明显的例子就是google、百度已经能抓取论坛帖子的发帖时间及回帖人数
做SEO就要走在搜索引擎前面,fuck the rules,and they die!

回复 支持 反对

使用道具 举报

发表于 2014-4-20 22:20:36 | 显示全部楼层
本帖最后由 minlab 于 2014-4-20 22:22 编辑

其实我最关心的是amazon链接有没隐藏.
1.amazon链接隐藏估计amazon会把你账号k
2.不隐藏链接的话估计google会把你的网站给k了.
.................................................
这个问题基本无解


回复 支持 反对

使用道具 举报

发表于 2014-4-20 22:22:12 | 显示全部楼层
现在采集amazon流量不好搞,同样是采集的我1月份搞到7k多刀,现在情况不怎么好,也在改变采集的思路
回复 支持 反对

使用道具 举报

 楼主| 发表于 2014-4-20 22:28:30 | 显示全部楼层
minlab 发表于 2014-4-20 22:20
其实我最关心的是amazon链接有没隐藏.
1.amazon链接隐藏估计amazon会把你账号k
2.不隐藏链接 ...

没隐藏,直链+nofollw。。

回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

QQ|联系我们|Archiver|手机版|小黑屋|EEfaq论坛

GMT+8, 2024-12-24 02:35

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表