百度lee:网页临时性打不开建议用503。503等同于告诉spider该页面临时访问不了,过段时间再来。如果网页已恢复,即刻正常抓取;但如果该页面长时间返回503,该url仍会被认作失效链接,从索引库中删除。页面永远无法打开才建议用404,或登录百度站长平台提交死链sitemap。
404状态码代表‘Not Found’,spider更新时会认为该页面已失效,此时呢将在索引库中删除,短期内spider再次发现该url不再会抓取。出现网页打不开的情况有两种:第一,网页临时性打不开;第二,页面永远无法打开。
针对第一类问题,我建议不要立刻返回404,而是使用503。503等同于告诉spider该页面临时访问不了,过段时间再来光临。关于503,spider会认为该网页临时无法访问,短期内会再光临。如果网页已经恢复,即刻正常抓取;如果继续返回503,短期内还会再光临几次,但如果该页面长时间返回503,该url仍会被认作失效链接,从索引库中删除。针对第二类问题,永远无法打开的页面,404,不用考虑。各种web2类页面删除后同样需要返回404告知搜索引擎该页面已失效。
对于已经删除内容的页面,最恰当的处理方法是:
1、直接做死链处理并返回404;
2、在百度站长平台死链提交工具中提交死链sitemap。
提醒一下各位站长朋友,当您的网站存在被发布大量垃圾信息时,请:
1、及时删除相关垃圾页面,并做404处理;
2、制作符合要求的死链sitemap;
3、登录百度站长平台,进入死链提交工具提交死链sitemap。