之前分享了关于《大型电子商务平台结构优化方案(一)》的些内容,主要是讲优化网站结构的知识,那今天我会继续来分享关于电子商务平台的那点事......
1、子域名和目录
搜索引擎通常把子域名(或称为二级域名)当做一个基本独立的站点看待,也就是说
和
是两个互相独立的网站。
而目录
http://www. seo9go.com /news/
就纯粹是http://www. seo9go.com 的一部分。
顺便介绍一下,www. seo9go.com其实是seo9go.com的一个子域名,只是约定俗成,网站一般以www. seo9go.com为主URL。
2、禁止收录机制
有时候,站长并不希望某些页面被抓取和收录,如付费内容、还在测试阶段的页面、复制内容页面等。要确保页面不被收录,需要使用robots文件或Meta Robots标签。
搜索引擎蜘蛛访问网站时,会先查看网站根目录下有没有一个命名为robots.txt的纯文本文件,robots.txt用于指令搜索引擎禁止抓取网站某些内容或指定允许抓取某些内容。
3、nofollow的使用
Nofollow是2005年有Google领头新创的一个标签(严格说是属性),目前主流搜索引擎包括百度、雅虎、必应等都支持。
由于nofollow属性能阻止蜘蛛爬行和传递权重,因此很快被SEO用在某些内部链接,以达到控制内部链接权重和PR流动及分布的目的。
4、URL静态化
建议尽量要静态化URL的原因如下:
1)Google抓取任何动态网址没问题,并不意味百度、雅虎、必应、搜狗、搜索等都没有问题。
2)Google所说的静态化的弊端,基本上是基于静态化做得不正确的假设。问题是要静态化就得做正确,这样假设是没有道理的。
3)用户体验。静态化URL便于用户更清晰、更容易读懂,更可能被点击。
5、URL设计
1)URL越短越好
一方面为用户着想,便于增加点击率,另一方面短URL也利于传播和复制。
2)避免太多参数
参数太多用户看着眼花缭乱,也可能造成收录问题。
3)目录层次尽量少
这里指的是物理目录结构。
4)文件及目录名具描述性
5)URL中包含关键词
关键词出现在URL中,也能提高页面相关性,在排名时贡献一点分数。
6)字母全部小写
A、全部小写容易人工输入,不会因大小写掺杂而犯错。
B、有的服务器是区分大小写的,如Linux服务器,无论站长自己在做链接时还是用户输入时,因为大小写混用出现错误都会造成404错误。
7)连词符使用
目录或文件名中单词间一般建议使用短横线分隔,不要使用下画线或其他奇怪的字母。
8)目录形式还是文件形式
两种形式对排名没有多大的影响。
6、网址规范化
1)为什么出现不规范网址
下面几个URL一般指的是同一个文件:
http://www. seo9go.com /index.html
http:// seo9go.com /index.html
但是从技术上来讲,这几个URL都是不同的网址,搜索引擎也确实把他们当做不同的网址。
除了以上,网址规范化问题还可能由于如下原因出现:
4CMS(内容管理系统)原因,使同一篇文章(也可以是产品、帖子等)可以通过几种不同的URL访问。
4URL静态化设置错误,同一篇文章中有多个静态化URL。
4URL静态化后,静态和动态URL共存,都有链接,也都可以访问。
4加密网址
4URL中有端口号
4跟踪代码
4显示的都是首页内容
2)网址规范化问题
网站出现多个不规范网址会给搜索引擎收录和排名带来很多麻烦。
网址规范化造成几个问题:
4CMS系统在不同地方链接到不同的URL,分散了页面权重,不利于排名。
4外部链接也可能指向不同URL,分散权重。
4搜索引擎判断的规范化网址不是站长想要的那个网址。
4如果网址规范化问题太严重,也可能影响收录。
4复制内容过多,搜索引擎可能认为有作弊嫌疑。
3)解决网址规范化问题
要解决URL规范化问题有很多方法,如:
确保使用的CMS系统只产生规范化网址,无论是否静态化。
所有内部链接保持统一,都指向规范化网址。
在Google管理工具中设置首选域。
使用301转向,把不规范化URL全部转向到规范化URL。
使用canonical标签。
提交给搜索引擎的XML网站地图中全部使用规范化网址。
4)301转向
301转向(或叫301重定向、301跳转)是用户或蜘蛛向网站服务器发出访问请求时,服务器返回的HTTP数据流中头信息部分状态码的一种,表示本网址永久性转移到另一个地址。
5)canonical标签
2009年2月,Google、雅虎、微软共同发布了一个新的标签canonical tag,用于解决网址规范化问题。