网站页面不被收录的原因是什么(网站更新的内容都不收录)

网站更新的内容不被百度搜索,看二个方面,(上线1-3个月)新网站,还是(一年以上)老网站

一、新网站内容不收录检查的事项:1.网站代码能否被搜索引擎抓取,可以通过百度资源平台,或者站长平工具通过模拟抓取,看首页的信息是能被搜索引擎抓取的到.

百度资源平台:https://ziyuan.baidu.com/crawltools/index 站长平台模拟抓取工具:https://ziyuan.baidu.com/crawltools/index

网站前端页面一定要使DIV CSS样式来写,有利于搜索抓取,不要用JS搜索不喜欢抓,基本不抓取,因为会比期耗时间。

网站页面不被收录的原因是什么(网站更新的内容都不收录)(1)

网站收录

2.检查网站的robots.txt文件,看没有屏蔽,不允许搜索引擎蜘蛛抓取一些网站栏目及页面信息。

如:淘宝就屏蔽了百度搜索对其页面的抓取,因为早期百度搜索也有做电商的想法,并上线了百度有啊平台,很可惜最终没有做起来,淘宝为了防止百度搜索蜘蛛抓取淘宝的页面信息。就屏蔽了百度蜘蛛的抓取

baiduspider 百度搜索蜘蛛 Disallow: 不允许抓取 : / 斜杠代表的网站的根目录,网站的所有页面信息

通过访问淘宝地址,可以看得出来 http://www.taobao.com/robots.txt

User-agent: Baiduspider Disallow: / User-agent: baiduspider Disallow: /

3. 检查网站的页面的质量,大量的空白,无内容的页面,全是图片页面并不利于搜索抓取读取页面的表达的意思,4.内容全是采集大量地采集在搜索引擎中早就存在的内容,新网站直接被搜索引判断为采集网站,降权网站的重要性等级,会严重景网站的收录及排名周期

5.网站路径问题每个页面对应唯一路径,如果一个页面有多个路径,影响收录,或者为了让网站路径简利于记录识别,网站原本动态路径,通过伪静态处理之后,生成了静态路径,而又没有利用robots.txt屏蔽动态路径。6.页面的质量度问题①内容丰富度高,图文并举,段落明了,层次构结良好②多个页面之间没有存在大量的重复内容,大量的多个页面重复内容,会导致网站页面的相似度过高,这种情况下搜索引擎会放弃收录,老网站会删除已收录的网站页面7 不可乱页面的标签,每个页面只有一个 H1标签, H2标签,H3标签其中页面的页面的标签一定要加H1标签【H1是标题标签】页面标题加H1标签有利于搜索的识别判断,这个就是当页面的主题。二、老网站内容不收录,①要分析从什么时候不收录的,特别是网站近三个月有没有出现故障,改动的情况,这些都可能会导致内容短期不收录,②老网站不收录,通过大量的示例,80%还是内容质量不行。没有很好地利于搜索需求来定义,标题及内容的质量度,这样更新的话题即没有包含、匹配用户会搜索的关键词话题及句子时,收录的优先等级就是最低的,不能满足搜索引擎优先抓取收录机制。

作者:每日学点SEO

来源:微信公众号【每日学点SEO】 \/: rdseo999

著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

,

免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com

    分享
    投诉
    首页