通过对搜索引擎工作原理的了解,搜索引擎预处理的第一步就是提取文字内容。因此作为SEO人员应该要尽量降低搜索引擎提取文字内容的难度,也就是精简HTML代码,使真正的文字内容比例提高,尽量减少HTML格式代码。其实从某种意义上来说,格式代码对关键词都是一种干扰,精简代码就是提高信噪比。
对于精简代码一般有以下常见的几种方法:
1、 使用CSS定义文字字体、颜色、尺寸及页面排版。
有很多网站既使用CSS,又在可见文字部分用style或font再定义一遍字体、尺寸等,其实这样是完全没必要的冗余代码。
2、使用外部文件。将CSS和JS放在外部文件中,页面的HTML中只要放一行代码进行调用就可以了。因此我建议在head之间是坚决不要放置没用的CSS样式或者JS代码的,这样可以提高有用文字的抓取率。
3、减少或者删除注释。代码中的注释只给程序员或者页面设计人员提示的,对用户和搜索引擎来说是毫无用处的,也将成为噪声。
4、减少表格,尤其是嵌套表格。现在的网页大多使用CSS排版,表格使用大大减少。
但是有的时候表格展现是必须的,也不用刻意完全避免,只要不出现多重嵌套,产生大量无用的代码就可以了。
5、文件大小限制。Google技术指南曾经建议,HTML文件最好限制在100KB以下,页面上的链接数量最好控制在100个以内下。而现在百度建议是HTML文件不要超过128KB。