请教什么方法能把amazon整站采集下来
什么方法能把amazon整站采集下来火车头?
API接口这种怎么弄,
楼主这是传说中的伸手党吗?:lol
楼主你这是要干什么呀
djg2000 发表于 2014-12-24 19:30 static/image/common/back.gif
楼主你这是要干什么呀
复制采集站。然后做垃圾站
垃圾站现在还能做出效果出来吗?
我能和楼主说amazon美国站的sku有两亿五千多万么;P
野心略大啊。用上服务器集群不眠不休跑几个月说不定能成?
LS正解
野心略大啊。
2亿多商品,单URL地址就20多个G,压缩一下还有10个G,要是全采集回来会有多大呢,自己算吧
真是张口就来啊,全部采集。。。。。额
楼主,我只能分享这些了,只是产品的URL和URL中的product name
leexiaochong XD 是已经尝试过了吗.呵呵
雄心壮志:lol
规模太大,要是做垃圾站还不如采集一个品类就做一个站
得不偿失啊,还是老老实实做吧
gant 发表于 2014-12-25 11:06 static/image/common/back.gif
leexiaochong XD 是已经尝试过了吗.呵呵
还没有,不知道能不能存储amazon product price:'(
亚马逊astore,采集都省了:lol
太给力的回贴了,采集一个品类可行,或是采集个几百万也是可行,全采集了是个大问题,由其@leexiaochong 回贴 这个数据量太大了。
early 发表于 2014-12-26 10:15 static/image/common/back.gif
太给力的回贴了,采集一个品类可行,或是采集个几百万也是可行,全采集了是个大问题,由其@leexiaochong 回 ...
我的想法是使用lucene进行索引,然后做一个amazon 价格跟踪的网站,但还不知道amazon允不允许存储产品价格。
leexiaochong 发表于 2014-12-26 17:21 static/image/common/back.gif
我的想法是使用lucene进行索引,然后做一个amazon 价格跟踪的网站,但还不知道amazon允不允许存储产品价 ...
lucene是java的把? PHP 用不了把?
页:
[1]
2