百度收录永远是SEOER着讨论的关键话题,在网站优化战争中,稳定的收录直接影响了网站的流量、收入。为何网站首页快照更新很快,可就是不收录内页?相信许多朋友与我一样在寻找问题的答案。本文落拓一起探讨下网站内页百度不收录的原因分析与对策。
原因1:百度已经索引了但还未放出来排名。百度对文章的收录需要审核时间,蜘蛛抓取成功索引内容录入数据库,需要经过二次审查是否为SPAM然后才放出参与排名,放出的时间与网站权重高低有着直接的关系,百度周期更新才放出收录是新站最为常见的现象。
对策:我们要做的就是保证定期定量的更新、观察网站日志,只要蜘蛛正常爬行,就静心等待着,会有惊喜的。
原因2:robots设置问题导致内页不受引擎蜘蛛爬行索引
对策:检查是否语法错误屏蔽了蜘蛛爬行,其中包括meta robots与nofollow等标签的的设置。
原因3:文章原创度问题,头部标签的设置导致页面类似重复,或者采集页面太多,因百度数据库中已经存在大量的相似信息而不收录,长期地操作会导致百度降权。
对策:应该保持文章的原创度(伪原创相信朋友们都熟悉),质量比数量更重要,最好是能每天定时更新让百度对你网站抓取也有守时的好习惯。
原因4:网站内部链接存在问题,比如有大量错误链接、不良的网站链接,蜘蛛爬行不通畅无法抓取,不良网址链接导致网站降权。
对策:针对首页、频道等各个重要页面做错误链接检查(可以观察谷歌站长工具的抓取错误),检查留言板、评论等网友互动功能的不良链接,避免与不良网站互链。
原因5:网站使用了黑帽手段,百度识别了欺骗手段整站降权。
对策:远离关键词堆积、群发,黑链等黑帽行为,网站的长期稳定少懂歪脑筋,百度一有动作就没很难挽回了!
原因6:服务器无法访问,速度缓慢、被挂马等情况。百度蜘蛛索引内容时,多次识别网站有着大量错乱代码或者遇到服务器无法访问,网站被列入观察名单。
对策:做好网站代码优化提高页面读取速度,选择负责任的安全空间服务商,成熟的网站程序并定期更新补丁,定期对修改文件痕迹做好跟踪。
除了踏踏实实地做好以上6点,落拓特别提出几点值得去做的:1、首页做好全站的网站地图,让蜘蛛顺利爬行到内页;2、内页的相关链接调用一定要规则化,让每个页面的主题更突出;3、外部链接可适当地做一些内页的蜘蛛引导。每个细节把握好让自己放下心,相信百度不会远离对我们内页的收录。(编选:中国电子商务研究中心 勇全)
(发布时间:2013-02-20 14:33)