巨野网站建设-网站制作设计公司电话:19969902837
  • 巨野网站建设手机站:m.seo11111.com
您当前的位置:网站建设 > SEO网站优化

总结了一套完整的百度SEO注意事项

时间:2018-04-25  来源:巨野网站建设  作者:小溪建站
  点击量:

  以下将要说到的内容都是基于百度这个搜索引擎的特点,再加上多年卡盟排行榜韩梓晨SEO经验总结而得,不管是个人站长还是职业化SEO人员都适用。这些经验是有长期跟踪数据支撑的,数据是不会骗人的,通过数据的变化我们

  以下将要说到的内容都是基于百度这个搜索引擎的特点,再加上多年卡盟排行榜韩梓晨SEO经验总结而得,不管是个人站长还是职业化SEO人员都适用。这些经验是有长期跟踪数据支撑的,数据是不会骗人的,通过数据的变化我们总结了一套完整的百度SEO注意事项。

  百度速度很慢

  百度是一个速度很慢的搜索引擎,相比谷歌来说慢的一塌糊涂,但是相比国内其他搜索引擎那就算是非常快的了。这里也要拆分下,第一是他的蜘蛛爬行情况,第二是他的数据库更新。

  a)百度蜘蛛爬行问题

  如果长期分析蜘蛛日志的SEOer会发现,百度蜘蛛访问次数、抓取深度、抓取量、停留时间都要跟谷歌差很多个等级。也就是说百度蜘蛛抓取效率很低,爬行速度较慢,单个访问抓取多个页面的能力很弱,对响应速度较大的页面抓取能力很弱。尤其是最后一点,跟谷歌的差距是很明显的,那到底原因何在?

  其实蜘蛛抓取能力是与搜索引擎的数据中心服务器数量、运维能力有关,单从数量上对比,谷歌在百万这个量级,但百度估计只有谷歌的十分之一。这也就造成了,谷歌单个蜘蛛一次访问最多可以抓取几十个页面,而百度很难超过10个。

  由于服务器资源的限制,百度蜘蛛的速度是很慢的,如果你的网站刻意优化过页面加载速度的话,那么恭喜你百度蜘蛛在你的网站上爬行不太会出现什么问题。但是如果你压根就没有注意服务器、页面加载速度过长的问题,那么百度不会很好的抓取完你所有的页面,对你的收录量会产生很大影响。

  这里建议大家去看看谷歌管理员后台中“下载页面所用的时间”这个数据,看看你的平均页面加载速度大概是什么样的,如果超过1000毫秒,百度抓取起来就比较费劲了。而且,大家更需要观察这个数据的总体趋势,尽量避免出现较大波动。如果用这个工具比较熟的人,还可以看下“抓取错误”中的数据,看看是否出现返回码408、500、504等与服务器错误相关的页面。如果谷歌抓取你网站的时候都遇到这些问题,那么百度是一定会出现问题的,建议大家以谷歌的标准来优化百度。

  另外,还是要教大家尽量站在搜索引擎的角度来理解问题。因为服务器资源有限,百度不得不严格把控这些蜘蛛资源,让他们更多的去抓取那些高质量页面,而不是浪费在那些用户体验不佳、页面质量低下的网站上。所以,搜索引擎会自己制定出一些规则(这些谷歌也是有的),比如:两次301的页面不抓、两个返回码的页面不抓、经常超时的页面不抓、404

  的页面不抓等等,如果你的网站在一段时间里出现很多服务器的问题导致页面响应时间过长,那么搜索引擎观察你一段时间后,他一定会减少对你的抓取,削减派到你网站上的蜘蛛数量,所有这些都源于“搜索引擎不会把蜘蛛资源浪费在用户体验不佳的网站上”,原因就是这么简单。

  还有,百度蜘蛛从技术上还没有解决好陷入死循环的问题,比如:房产网站大量属性页面,电商网站产品筛选属性等等,这个东西其实跟速度无关了,只不过类似这种大量筛选属性的页面设计会导致蜘蛛陷入死循环,不过谷歌是可以自己解决一部分的,可百度依然很笨,很容易陷进去不能自拔。这个就需要SEO人员做很多措施来帮助搜索引擎避免过度抓取这些筛选页,这里顺便提一句,其实解决办法谷歌站长指南中早已经写的清清楚楚了。

  b)数据库更新能力

  常常看到各种SEO论坛、qq群里有人抱怨,我的快照怎么不更新啊,快照怎么回档了等等的问题,这些都是百度大搜索业务建库部门的事情。何为建库?就是为你的网站建立一个索引库,那么这个索引库也不是随便建的,而是先将网站分成三六九等,然后根据等级来规划每个库的更新频率。因为这么大的数据量,每一次建库是很消耗服务器资源的,所以重要的网站、原创内容多、用户喜欢的网站数据库更新就较快,一般的小网站更新频率就很低了,常年不更新的网站可能每年给你更新一次就不错了。

  那如果你网站出了问题,比如:网站服务器长时间宕机、无法访问、大规模404、作弊等,严重的百度会将你的页面暂时放置到更低级的数据库中保存,但是会删除线上历史收录页面。也就是说,你的site值没了,但是百度索引中保留你的页面,而且还给你降权了放到了相当低级的数据库中保存,这样的话,你是页面几乎不会被更新了的。

  c)页面相似度判断(这是额外加的一段)

  做过外贸的SEOer都知道,相似页面在谷歌上是会遭到严重惩罚的,是致命的,已经有无数大中型网站甚至很知名的网站倒在了这个问题上。但是,回过头来做百度你会发现,百度对相似页面的判断机制是很挫的,相似度稍微高一些是不会被百度惩罚的,那是为什么呢?原因还是在服务器资源上,因为页面相似度判断过程是需要大量计算的,没有一定的数据处理能力是很难把这件事情做得很好。所以,你会发现在百度多多少少重复一些无所谓的了,搞一些采集来的内容无所谓的了,随便做做伪原创也是可以顺利收录的等等。

  但是百度也不是太笨,他知道自己存在技术缺陷,那好那我就把惩罚机制做得严格一些,一旦你被我的系统捕捉到,不好意思我会重重的惩罚你,短时间内你是甭想恢复了。这就是百度的策略,很粗糙吧,原因就是很多技术细节不达标嘛。

  前面我们说的百度SEO注意事项都是与百度自身相关的,比如:服务器资源、抓取、技术等问题,今天就聊一些与SEO人员日常工作密切相关的事情,注意一下几点可以让你的SEO项目更加有的放矢,更加可控的产出流量。

  从百度的角度规划SEO策略

  首当其冲就是百度SEO策略的制定,这里要分两个部分,第一个就是从百度的未来发展来规划你的SEO策略。有人会问,策略是什么?策略往往是一个框架,是一条主线,大的战略方针。不光整个公司要有战略方针,细分到每个工作种类也都是要有自己的战略方针,那么这些就是分支,林林总总的分枝合并在一起就形成了公司的目标。

  那怎样从百度的法阵看你的SEO策略?首先我们先看下百度最近一年在大搜索业务线做了哪些事情。

  1、完善百度站长工具功能

  大家都用过百度站长工具,最初百度推出的比较重要的功能就是sitemap提交功能,当时还要发申请才能获得测试码的,而现在基本上全部放开。从百度的角度,这个sitemap提交工具的目的是什么?其实就是要扩充百度内容量,因为搜索引擎是有其自己的局限性的,抓取到的内容仅仅是互联网中冰山一小小角。多年前谷歌公布过自己的抓取页面量,仅仅占到了互联网总页面量的5%,这个数据已经让大众非常吃惊了,如此技术实力强大的搜索引擎公司竟然只索引了互联网中这么小的一部分内容。可是,令众人更为吃惊的是,谷歌紧接着更新了一下这个数据,说之前的数据可能有误,经过精确计算,可能2%左右,这个数据让众人大跌眼镜。

  当然,如今的搜索引擎不管是资源还是技术实力又上了一个台阶,而且期间也做了很多挖掘暗网的项目,这个数据可能要增长一些。那么,我们仔细分析一下搜索引擎这个现象,这个事实说明,由于技术的局限性及互联网页面暴增的速度过快,使得搜索引擎仅凭自己的蜘蛛在互联网中抓取内容,是远远不能满足用户的需求的。比如:有很多需求是无法在搜索引擎上获得很好的解答的,像搜索一些极其专业性的话题,在互联网上你是很难找到一个页面符合你的需求,你需要利用各种搜索技巧、搜索很多遍、翻很多页才能找到一些残值片语,这样的情况很常见。

  为了解决这个问题,搜索引擎肯定会开放接口,让用户自己来整理数据提交数据,来完善搜索引擎索引库。这个方法很好的解决了一部分挖掘暗网的问题,由此可见,搜索引擎对原创内容、独特内容的渴求度有多高。那么我们要做的就是将那些层级较深、没有被抓取过的、抓取次数少的页面做成sitemap提交给百度,这个会大大提升你的收录量。

  2、ping机制

  用过wordpress的人肯定知道ping是怎么回事,其sitemap插件中就包含这样一个自动ping功能,这个功能可以在规定时间里自动通知蜘蛛来抓取你的内容,这个东西百度也是抄了谷歌的,最早是没有的。

  ping

  的目的也是为了提升蜘蛛的有效抓取,很好的扩充搜索引擎的索引库。所以,大家在做sitemap的时候一定要加上这个ping机制,规则可以自定,比如:新上线sitemap可以ping全量,以后每次更新5个小时ping增量等等,这些规则可以视自己网站的更新频率而定。

  另外,百度官方对ping机制还讲了一个功能,就是通过ping的时间来判断谁是原创源,这个功能也是很有用的,因为小网站的内容总是被大网站采集、抢走流量,有了这个功能,可以解决一部分问题。

  3、原创星火计划

  原创星火计划着力解决的问题就是原创页面的判断,提升原创页面的排名,让更多的坚持原创的网站获得更好的流量。这个会大大提升原创者的积极性,让整个互联网更加公平,原创者更多、高质量内容更多、用户黏性越高,这对搜索引擎的长远发展是有很大的意义的。

  那么我们SEOer在制定SEO策略时目标就很明确了,尽管这个项目影响的范围还不是那么大,但是,其明确了搜索引擎未来发展的方向――“不断提升原创页面流量”。那么好,现在SEO策略就很明显了,就是要坚持创造大量原创页面、删除或屏蔽低质量页面,这两个步骤会让你的流量保持很好的增长趋势。具体实施的方法有很多了,也要视网站自身的情况而定,希望大家多动动脑筋,ROI高的方法有一堆。

  4、百度绿萝算法

  百度在2013年推出的另外一个大的项目就是绿萝算法,他的目的就是清理低质量站外链接,详细的不做讲解,透过这个项目我们可以看到,百度在着力解决一些网站依靠大量发送低质量站外链接来提升自身权重的行为。

  这也是一种不公平现象,高质量页面因为没有更多的站外链接导致排名不佳,而低质量页面因为自身资源拥有大量站外链接,可以轻松排到第一。但对于搜索引擎看来,长此以往搜索结果中就会充斥着大量低质量内容,用户体验越来越差,这是百度不想看到的。

  另外,这也预示着,从今天起,站外因素的重要性会越来越低,这会直接影响SEO策略的制定。建议大家把重心放到站内优化,如:原创页面、站内推荐、站内资源整合等方面,千万不要把大量的人力、物力再放到站外因素了,因为这会大大降低你的ROI,不划算的。

  制定好网站中长期SEO策略

  现在知道该怎样制定SEO策略了吗?大的战略方针只有一个,――“原创、站内资源整合”。坚持这条主线会让你受益匪浅,那么下面我们就要把策略细化,制定中长期SEO策略。这里不再纠结是否热词、长尾,答案是必然的长尾,因为热词仅有5%-10%的占比。

  首先,你要了解现在网站的情况,是内容量较少的小型网站,还是内容量持续增长阶段的中型网站,还是内容量基数已经很庞大的大型网站或者超大型网站?不同的网站级别是有不同的SEO策略的

  缺乏内容的小型网站,这样的新站我们的建议策略是快速提升内容建设(抓长尾流量)、加以技术改造、大量创造高质量页面,这样可以有效提升收录量,高质量页面收录越多,权重提升越快。这个时候你需要把所有资源拉过来去搞内容,就不要去做什么友情链接、站外链接了,投入产出很小的,最好是靠UGC产出内容,这就需要有一定的运营能力,你可以叫上相关产品经理帮你搞这个事情。

  再细分下去,创造大量的内容,是要有切入点的,比如:如果你是电商,那么好了,你的产品量就是个很庞大的内容扩充点,还可以加入用户的点评、晒单、互评等。如果你是一个小行业,本身就没多少产品,那么我们很难从产品词获得更多的页面产出,但是我们可以从问答型关键词创造内容,你可以运营一个社区,里面有用户、有专家,在这里用户可以发问,专家会及时为他们解决问题,用户之间还可以互动等等,这个需要你配合产品经理制定一个运营策略,更好的帮助用户解决问题、并且留住他们。这就是我之前说的UGC,靠用户产生内容才能做到快速、大量的内容产出。

  如果你是中型网站,那么我们建议SEO策略是继续扩充内容量(抓长尾流量)、资源整合、流量最大化这三个方面。高质量的内容不断产出永远是你网站权重提升最有效的手段,所以这一大块不能丢,要持续下去。那这个时候其实网站已经积累了很多的内容了,有了这些内容资源你可以做很多事情,比如:聚合页,详细不讲,里面需要注意的细节有很多。而且也不仅限于制造新的聚合页的,如果你把所有有效着陆也都看做一个聚合页的话,那策略又不一样了。

  最后,流量最大化最难搞,你可以ga里统计下这一年的流量数据,看看在这一年里有多少页面产出过流量、带来流量的关键词有哪些、各类页面的流量占比分别是多少,他们被站内推荐过多少次(也就是获取站内多少资源)、有哪些页面收录了也获得很多的站内资源,但在这一年里并未产出流量,这些数据都要看一下。你只要看了数据,解决方法也会很快就可以想到。

  如果你是大型、超大型网站,那么ok了,SEOer的主要工作就是刻意优化长尾词、资源整合、流量最大化。因为网站权重很高了,只要稍微优化一下长尾词,有收录就会有流量,而且收录和引流的速度都会很快的。那么长尾词优化到一定程度,可以根据数据做资源整合、流量最大化处理,其目的是让单个页面的流量产出达到最高。

  以上梓晨没有说很细,很多方法、技术细节都需要大家自己去执行中发现和总结的,而且每个人想到的方法可能不太一样,这根网站本身的资源也有关系,但是大家都可以做的事情就是真正的去执行,只要你去做,就一定有收获,卡盟排行榜韩梓晨谢谢大家。

相关文章
  发表评论 共有 条评论 
用户名:
验证码: 匿名发表
版权所有:巨野县梦宇广告设计工作室  鲁ICP备18038385号-4  电话:19969902837  微信:juye_com   QQ:281598883