黑帽联盟

 找回密码
 会员注册
查看: 1434|回复: 0
打印 上一主题 下一主题

[seo教程] 网站文章不收录的原因总结及对应的解决办法详解

[复制链接]

895

主题

38

听众

3329

积分

管理员

Rank: 9Rank: 9Rank: 9

  • TA的每日心情
    难过
    昨天 22:31
  • 签到天数: 1652 天

    [LV.Master]伴坛终老

    对于刚做SEO优化的人员来说,无非这个问题问的最多,网站文章百度怎么不收录的问题,或者有些网站文章都更新十几天了还不收录,甚至有的网站更新的是原创文章,百度搜索引擎还是不收录,而有些网站甚至伪原创的都可以达到秒收,那么这些问题到底是什么原因导致的呢?又如何去解决呢?下面由黑帽联盟为大家全面解析文章不收录的原因!
    1-1F10413122A60.jpg


    一、搜索引擎不收录文章到底是什么原因导致的?

    1、网站是新站

           如果网站是新站,那么网站是在审核期,搜索引擎对网站的信任度还很低,文章收录率比较低这是正常现象,原因是网站并没有在搜索引擎获得足够的综合页面评分数,所以大部分新站只是收录了首页,或一两个内页链接。一般搜索引擎在新站停留时间不会很久的!

    解决方法:

           ①、建议把网站首页和内页进行发布一下外链,诱惑蜘蛛来爬取,进而增加baiduspider在网站的停留时间!

           ②、到百度站长平台提交链接,为baiduspider提供爬取通道入口


    2、网站的文章大部分是采集复制过来的

           网站的文章大部分是采集复制过来的,导致网站文章不收录或者收录率极低,该怎么增加网站的收录呢?这种情况目前在互联网上情况最多的,情况基本出于你网站没有得到搜索引擎的信任,没有新鲜内容的支撑。反之,有些网站即使伪原创也可以达到秒收,那也是该网站已经得到搜索引擎很高的信任度了。面对大部分网站是采集或者伪原创,而相对都比较渴望得到解决方法,而往往都没有真正的被解决!下面这几种方法会为你解决这个问题!

    解决方法:

           ①、通过百度站点工具主动推送和外链发布引诱baiduspider来网站抓取文章,如果过了一两天都还没收录,可以通过网站日记查看baiduspider是否有在抓取这条连接,如果有在抓取连接,但是就是不收录,那么就要进行下一步计划了!

           ②、修改标题以及内容正文的开头部分,没错,进行修改一下这篇文章的标题以及内容,baiduspider有在抓取这条页面连接但是就是不收录,说明这篇文章重复率相似度很高,搜索引擎索引库已经存有大量同样/相似的文章,没有必要再去收录了。通过修改文章标题以及内容这是很有效的办法,如果还不收录再继续修改一下正文的内容,这样收录将有很大的提升。

           ③、在各种不同的平台,多发布几次外链,并在底部填写该页面的链接,对该页面也有一定增加收录的。

           ④、重新更新制作一个sitemap文件,把网站的链接全部提交百度站长平台的链接提交选项进行提交。老虎sitemap生成器可以实行效果,这种情况使用最好是一个网站大量文章是采集得来的,对此这种方法还是有一定的帮助的。


    3、更新文章的都是过时过期的文章,老生常谈之内容。

           有些网站更新的文章都是一些过期过时的、老生常谈的内容,搜索引擎都不知道过滤N遍了,居然在你网站又出来,然后结果肯定是悄悄地来,轻轻地走。所以即使采集也要采集一些新鲜内容,这样收录率才会有所提升。到了这里,可能有些SEOER会问我,SEO文章不就是那几篇文章写来写去吗?那你告诉我什么是新鲜内容。我只想说,你不去创新,永远都是采集来的文章,那为什么别人又可以创作新鲜的内容呢?

    解决方法:

           ①、多去一些问答平台,交流论坛去走动,看看他们交流的一些核心问题还有什么是没有解决的?然后你通过各种资源、人脉、网络整理出一个新颖的文章。

           ②、给网站写一些独特软文、故事式软文,增加网站的新鲜血液,提升网站的原创性对网站的收录率有很大的提升。

    4、内容出现敏感词,baiduspider排斥

           写文章尽量使用一些规范的语句来描述,不要弄一些用户无法看懂,baiduspider无法识别繁字体,特别是一些百度和论坛都屏蔽的语句,也许是文章内容存有敏感词而导致文章不收录索引呢!虽然这种情况存在几率较小,但是还是有一定的几率存在的。

    解决办法:

           ①、在不收录的页面自行检查是否存在敏感词,也可以在百度搜索敏感词在线检测工具进行检测,把一些存有敏感词的语句去掉。

    5、文章更新的是原创文章,但还是不收录或者收录较慢

           像这种情况,是因为网站在搜索引擎的索引库页面综合评分不是高,搜索引擎对网站的青睐度是很低的。

    解决办法:

           ①、更新一些新鲜内容,不要更新的一些文章是二次制作,过时过期、老生常谈的文章内容。

           ②、为网站多制作一些链接爬取通道,比如多交换几条友链,各平台外链的发布,诱引蜘蛛来网站抓取链接。

           ③、对网站进行整站优化,提升网站的综合评分,baiduspider不来收录,有很大的因素是因为网站的综合评分不高,这时候要把网站综合评分提高,比如把一些不参与排名的页面链接用nofollow标签掉,并更新一些高质量的文章,吸引更多用户来网站浏览,把控好页面的跳出率,尽量原创最好。但是低质量的原创文章还是不要更新,什么是低质量的文章?写的文章网络观点千篇一律,只是稍微换种说法,二次创作罢了,百度搜索切词技术还是挺强大,还是能够检测出来的。


    6、频繁修改标题和网站结构以及网站标签也会影响收录

           网站如果经常修改标题和网站结构及标签,会被搜索引擎重新拉入观察室,重新对网站进行考察以及排名排序,不仅降低搜索引擎对网站信任度,甚至还有可能引发降权的迹象,而且对网站的收录也有一定阻碍,百度快照日期也不会更新。

    解决办法:

           ①、到百度服务中心/快照更新投诉到百度中心审核,进行百度快照申诉更新,可以加快快照的更新速度。

           ②、多更新几篇高质量原创内容进行恢复排名,百度快照和排名会有所恢复。
    1-1F1041315131C.jpg

    二、导致百度搜索引擎不收录文章的其他因素

    7、robots文件禁止搜索引擎抓取

           是否在最近有动过robots文件设置,不小心把文章html的链接都禁止爬取了,到百度站长平台进行检查一番,如果存在有异常,直接到后台修改回来即可!如果不懂的可以去了解(Robots内部语法详解

    8、网站存在大量404、503没有进行处理,影响页面索引

           如果网站存有大量404、503错误页面,会导致搜索引擎很难抓取页面的,对于搜索引擎来说,你网站的内容价值和链接数量决定搜索引擎在你网站的停留时长,而且存于大量死链对网站的综合评分也会有所降低的,所以一定要及时地去处理好死链。

           解决办法:可以利用一些死链检测工具来为网站检测,比如:xenu、爱站工具等去检测死链,然而把死链连接放在txt格式文件,上传到网站根目录,最后到百度站长平台死链提交选项,把死链文件提交上去等待即可!

    9、网站优化过度,网站降权引起的百度不收录

           网站无论优化过度还是出现降权了,都是导致baiduspider不收录页面的,这时候需要自己分析最近几天对网站做了什么,是否不小心导致优化过度了,或者做了一些令搜索引擎排斥的事情,思考分析一下,找出原因并修改回来即可!

    10、频繁在主动推送提交未收录页面

           文章编辑发布后,一般人都会去百度站长平台提交链接或者主动推送链接,这本来是好事,但是你看着文章提交链接好几天了还不收录,于是你每天都去提交一篇这条链接,甚至有些还是提交几次来着,咬着牙说,看你还不收录。但是往往你越是这样,网站对收索引擎信任度越低。我们知道网站内容页收录,涉及到搜索引擎最基本的原理,那就是爬行,抓取,建立索引,收录等过程,这原本是搜索引擎来网站抓取主动行为啊,你要明白,百度提供提交链接入口,主要原因是维护原创的利益,让SEO优化的人员编辑文章发布后,第一时间提交链接为搜索引擎提供爬取入口来网站抓取,防止被其他人抄袭。但是站长们完全搞混了当初百度建立主动推送的真正意义。

           解决办法:原创文章编辑发布后,使用主动推送入口最后,更快能让搜索引擎来抓取网站文章链接,但是你提交链接后就不要再提交了,可以通过日记分析搜索引擎有没有来网站抓取该链接,如果抓取了,但还是没有收录,这时候你不要再去推送链接,可以适当地去修改一下文章的标题及内容,也有可能是你文章标题在互联网上已经存在一模一样的,或者文章已经存在千篇一律,适当地去修改能够使搜索引擎更好的收录。

    11、服务器问题

           若是服务器响应速度慢,经常会出现打不开,那么baiduspider来网站抓取页面就会收到阻碍。从所周知,搜索引擎来网站抓取页面的时间是有限制的,当然网站权重越高,抓取页面时间越长。如果导致大量服务器访问速度稳慢的因素存在,或者主机空间是国外或者是香港主机,那么就会导致搜索引擎来网站抓取页面的速度没有达到最佳效果,也许没有抓取几个页面,搜索引擎就离开了网站了。

    解决办法:

           ①、黑帽联盟建议购买国内备案主机服务器,一个网站想要长期发展,好的服务器是必须具备的,无论是对用户访问还是对搜索引擎抓取页面好处还是很显然的。

           ②、利用好robots文件,也能让搜索引擎很好的抓取页面,把一些不参与排名和无需抓取的页面Disallow掉,让搜索引擎不必在不重要的页面徘徊抓取,让搜索引擎放在重要的页面抓取,省掉不必要的抓取时间。

           ③、减少HTTP请求提高网站的访问速度,尽可能的减少页面中非必要的元素,一般由图片、form、flash等等元素都会发出HTTP请求,合并脚本和CSS文件可以使网站减少HTTP请求。

           ④、网站避免出现过量的死链,也会使搜索引擎重复抓取死链浪费抓取配额时间,从而影响网站收录,而且大量出现死链会降低网站的综合评分,所以及时的发现死链并处理掉就变得尤其重要。

    后记:

           我们在做SEO优化中,有时候往往会出现文章突然不收录或者其他各种问题,但是往往越到这时候我们越不能乱,冷静下来分析最近做了什么改动,或者网站出现了什么异常,找出原因是什么导致的,并修复才能使搜索引擎很好的收录网站页面。

    帖子永久地址: 

    黑帽联盟 - 论坛版权1、本主题所有言论和图片纯属会员个人意见,与本论坛立场无关
    2、本站所有主题由该帖子作者发表,该帖子作者与黑帽联盟享有帖子相关版权
    3、其他单位或个人使用、转载或引用本文时必须同时征得该帖子作者和黑帽联盟的同意
    4、帖子作者须承担一切因本文发表而直接或间接导致的民事或刑事法律责任
    5、本帖部分内容转载自其它媒体,但并不代表本站赞同其观点和对其真实性负责
    6、如本帖侵犯到任何版权问题,请立即告知本站,本站将及时予与删除并致以最深的歉意
    7、黑帽联盟管理员和版主有权不事先通知发贴者而删除本文

    勿忘初心,方得始终!
    您需要登录后才可以回帖 登录 | 会员注册

    发布主题 !fastreply! 收藏帖子 返回列表 搜索
    回顶部