采集的问题
昨夜,不,应该今天早晨写了三个规则,开着火车,睡觉了,醒来数据入库正常,无乱码,无丢失,进入后台随即检查几篇内容,无XX。兴奋的生成栏目了,点开列表,显示摘要,点开内容,显示空白!
继续刷新,无果,继续生成,不变。
进入后台,内容全在,保存离开,前台变了。
缩略图出现,内容也出现。
欧耶,好了。只有这一个是好了,我试着点了第二个,成功。但是我不会去点第三个了,采集了这么多,我怎么点。
四处求职,得到以为高手指点,在他的指点他,他困惑了,论坛求助,发现了同类,他的操作模式如同我上述方法,手动解决。
我试着在本地测试,同样。
我还在暗骂,网易的编辑好YD,居然防采集都做得这么强大。用代码去看采集的内容,有些不必要的代码,在规则中过滤了一下。
比如<div <a $nbsp
再次测试,成功。
其实最初的解决方法我是想在sql中下手,替换一些东西,可苦于sql知识匮乏,只能选择后者,重新采集,删除重名。
其实很多人在鄙视采集,但很多人依然在采集。
这是一个很矛盾的事情
如果涉及知识产权、版权的东西,还是不要碰了。免得惹事法律纠纷,这年头,法治社会了~动不动都讲究河蟹。
火车采集之葵花宝典下载
自宫之后截图PM我,全套无码高清DVD倾情免费奉献!
额。。。采集,用WP前我弄过P8的采集。。。。。。
- -!wp用robot自动采集~