因此需要专业的谷歌优化师去做相关优化以符合谷歌的要求,让我们外贸官网能被收录,获得排名,展示到国外买家眼前,获得更多的订单机会!
那谷歌优化工作遵循的搜索引擎收录原理是什么呢?本期就带你了解一下!
网站,其实是独立的存在,一个新站建好后,搜索引擎是无法得知它的存在的,除非谷歌派蜘蛛来抓取。蜘蛛是谷歌的一种重要抓取技术,也是网站被收录的来源,而源代码就相当于它的网,让它爬行于任意网页的源代码中。
当在源代码中发现另一个新的链接时,它就会通过这个链接穿梭到另一个页面继续抓取→爬行→抓取→爬行……从而达到网页被收录的目的。
问题来了,怎么才能吸引谷歌蜘蛛来抓取我们的网站?可分为四大点:
谷歌喜欢抓取新的东西。蜘蛛对新站抓取频率比较高,但如果你不常去更新,当蜘蛛多次来时都没有发现新的信息可以去抓取,那么慢慢地会减少光顾频率,从一个月一次到几个月一次。
当蜘蛛不来抓取你网页的源代码时,你网页中新的信息是不会出现在搜索引擎里的。所以建议新站在头1—3个月之间,要保持经常更新信息。
那么蜘蛛会经常关注什么平台呢?像Facebook、Twitter、Alibaba、维基百科等大型的平台都是蜘蛛常去光顾的,这就需要我们将网站链接发布到这些平台,给蜘蛛增加导入路口。
蜘蛛最先访问的是网站的首页,而网站里又包含了非常多的页面。以国际站平台为例,一个平台里上传了1000个产品,当从首页开始需要经过多次点击跳转才能访问到第200个产品的详情页,那么这个详情页无疑是离首页距离很遥远的,因为点击跳转的次数太多太繁琐,蜘蛛也是懒的去抓取的,尤其是新站权重不高的情况下。
网站是需要养的,需要经过一段时间去沉淀数据的,权重越高的网站,蜘蛛的抓取频率会比较高,对于新站来说,建议至少养3个月到半年的时间。
蜘蛛每天抓取的页面非常非常多,但这么多的页面谷歌不可能全部保存。谷歌会通过它的预处理也称索引机制,将蜘蛛所抓取到源代码数据中的核心关键词信息挑选出来。那么谷歌是怎么挑选呢?
蜘蛛抓取的页面中包含很多源代码,预处理要做的事情首先是先把代码中的文字信息提取出来,包含标签文字、图片替代文字、链接锚文字、正文。
在提取的文字信息中会包含很多例如the,a,an,to,of的词,这些词就像我们中文的啊、哈、呀的感叹词,出现频率很高,但有没有都不会影响内容中的主要意思,这些词称为停止词,也会被过滤掉的。
在网站的页头、导航、正文、页脚中会存在大量的重复内容,在这些页面中几乎都会有相同的源代码,谷歌会把重复的内容去掉,只留下不重复部分。
大多网站,往往将一个产品覆盖很多关键词并重复发布,几乎产品的详情页都是一样的。但这种方法并不适用于谷歌,因为当用户在搜索浏览前几页内容时多次看到同样的内容,对用户的体验会很差,谷歌是不会对重复内容重复收录的。
从这些过程中,谷歌可以判断你的网站质量。
在预处理环节,谷歌已经过滤很多不必要的信息,最后进行非常重要的环节—排名的相关性计算。没错,就是排名,但是排名的相关性计算绝不是凭单一因素就可以决定,这里总结出大家都认可的4点重要因素:
频率=关键词的出现次数,举个例子,谷歌提取出源代码的文字信息有100个,而关键词basketball sock在里面出现了10次,那么密度就是10%,理论上说关键词出现次数越高,密度越高,则页面相关性越高。
但是,以前有很多SEO人会利用谷歌这个漏洞去堆砌关键词,所以谷歌对这方面进行了一系列的算法升级,现在如果还这么做,一旦谷歌查出来,网站是会被惩罚降权的。
所以,一切都得要合理,不要过度滥用。
在网站的页面的源代码中包含了很多标签,有些标签代表小标题,有些代表图片…当关键词出现在某些标签位置时,关键词和页面的相关性会更高,这些位置往往会包含标题、黑体字体、图片Alt标签等等。
如果我们在外部网站如博客、论坛、社区平台,在相匹配的关键词锚文本中添加了我们的网站页面,这对页面相关性的提升有很好的帮助。
如果你的网站链接能够出现在某一个权威性的网站,并且链接了与网站相关的锚文本关键词,那么你的页面的相关性会越高。
谷歌蜘蛛爬取网站内容进行网站的收录工作,在收录的数据库里,按照谷歌算法规则进行排名,这里需要注意的是,与百度算法不同的是,谷歌会先收录再判断,而百度是先判断再收录,这样的算法规则就会导致谷歌有的网站收录会出现下滑的现象,而且这种算法规则在不断的变化之中,总体来说,有迹可循,但需要适时调整规划战略!所以选择一个专业团队,还是很重要的!