|
合法有效的HTML代码
许多网站设计者最常犯的错误便是当其网页能够在IE下正常显示便认为其代码正确无误,甚至常看到有人在抱怨其网站排名不理想,到其网站简单看一下便可发现HTML代码中充斥各种各样的错误,在那样的代码基础上无论付出多少努力去优化网站结果都可能是付诸流水的啊!
事实上,IE是一款对HTML代码容错能力甚高的的浏览器,——说句题外话,尽管我们可以有各式各样的理由可以攻击微软,但微软对其产品操作的易手性及可用性方面所做的努力是不容抹杀的。——Web页面能够在IE下正常显示绝不意味着页面的HTML代码没有问题,甚至可以推而广之,Web页面在多种浏览器下均可正常显示也不意味着HTML代码完全合法有效,毕竟哪个浏览器都要保证基本的容错的功能,不然,就会发生即使仅仅因为网络传输中的一点导致导致HTML页面显示不正常了,而这在网络带宽仍然紧张的今天仍是频繁发生的。(媒体)
什么是合法有效的HTML代码
简单说来,我们的Web页面是由HTML(Hypertext Markup Language : 超文本链接标示语言)元素构成的,即使对于ASP、PHP之类的动态页面,其也是由SERVER将ASP或PHP语句渲染成相应的HTML元素并下传到客户机上;对于JavaScript之类则由客户端将其转换为HTML。
同其他语言一样,HTML也有自己的语法规则,无论是浏览器还是搜索引擎的Spider都在根据这些规则来分析网页代码中的内容。但很多时候,即使对熟练人员来说,在HTML页面构建时仍然难免出些HTML代码上的错误,更别提大部分所见即所得编辑器造成的HTML冗余臃肿问题了。
如果页面中不存在违背HTML标准语法规范的成分,即可被称为合法有效的HTML代码
合法有效的HTML代码对SEO的重要性
要使搜索引擎收录我们的网页,——在此基础上才能谈网站优化网站推广——其前提是要让搜索引擎的Spider能读懂我们的Web文件。搜索引擎Spider阅读网页的根据便是HTML规范,通过对HTML代码的分析,Spider才能判断网页内容,在此基础上才能判断针对相应关键词的相关性。
需要明确的是,搜索引擎Spider不同于浏览器的一点便是其容错能力相对于浏览器要差不少,如果页面代码中存在其无法解释的HTML代码时,其便可能停止阅读该页面甚至可能停止在我们的网站内爬行,更严重的错误甚至会导致其同时也丢弃已经收集到的网站内其他页面的内容信息。
尽管如今如大主要搜索引擎也都在尽力提高Spider的容错能力,让其可以在HTML代码出现一般性错误时不至影响对内容的收集。但很多时候,仍然会发生如漏了一个关闭标签导致整个页面的内容被忽略的情况。
另一方面,合法有效的HTML也可以保证Web页面可以在多种浏览器下被正确解释,避免同一个页面在IE下显示正常在Mozilla下却严重变形的情况(当然,不能完全避免),这对于提高网站的可用性方面也是有着极大好处的。
如何验证HTML代码的合法有效?
Internet有很多类似的免费服务可以帮我们验证网页代码是否合法有效,其中最著名的即是 W3C HTML Validator ,这是由W3C( World Wide Web Consortium:万维网联盟)官方推出的免费服务项目,在其页面上只需输入待验证的HTML地址或者上传一个在本地机上的HTML文件即可,其会很快返回校验结果,是否无误,如有错误分别为哪些及如何改进等。
同时,W3C HTML Validator也提供对CSS文件的验证服务。
一定要通过W3C的验证么?
对这个问题的答案则不那么绝对。
理论上说,合法的HTML代码能够使搜索引擎的Spider在更容易地收集网站页面的内容信息。但另一方面,并不是所有的HTML代码错误都会影响到Spider的爬行,也即是说,HTML存在少量的错误对Spider来说也是可接受的,那么,一定要通过W3C认证么?
另一方面,如在Mark Daoust的测试中,甚至暗喻(未肯定地下结论)存在少量HTML代码错误在页面在Google排名中能更占优势,当然这存在很大争议,但至少证明了存在少量HTML代码错误并不影响网页在SERP中的排名。
个人观点,如果您对HTML相对不那么熟悉的话,倒也不必强求非得100%通过W3C的验证,毕竟把更多的时间与精力放到真正应该努力的方向如创建内容与链接才是根本,但要保证HTML代码中不存在大的严重性错误。当然,如果您对HTML语言较为精通,那么,何妨稍花点功夫以确保其完全无误呢?正如在上篇文章中所说的:
因此,我们要做的倒不一定非得通过W3C认证,但至少要保证其在各种浏览器下显示正常,保证搜索引擎的Spider能够正常分析。
提高HTML代码的效率
前文我们提说过很多所见即所得编辑器造成的HTML冗余臃肿问题,这种情况在很多中文网站相当普遍。所见即所得编辑器如FrontPage、Dreamweaver,尤其在其对一个网页进行修改的时候,往往会产生很多不必要的冗余代码。当页面的HTML文件在存在大量的冗余代码时,文件便会变得臃肿,这不但会降低网页的打开速度,损害到网页的效率,同时也会严重影响到相当网页的搜索引擎排名。
与其把精力投入到一定通过W3C认证上,个人认为,倒不如把更多的精力放到精减代码上,如引入CSS等,以实现代码的干净简洁。这样的优化效果会更明显。
《合法有效的HTML代码》结束!
在合法有效的HTML代码一文中,我们谈到过所见即所得编辑器造成的HTML冗余臃肿问题:所见即所得编辑器如FrontPage、Dreamweaver,可以帮助我们简便快速地创作或编辑HTML页面,但在生成“干净的”HTML代码方面则是个弱项,尤其在其对一个网页进行修改的时候,往往会产生很多不必要的冗余代码。当页面的HTML文件在存在大量的冗余代码时,文件便会变得臃肿,这不但会降低网页的打开速度,损害到网页的效率,同时也会严重影响到相当网页的搜索引擎排名。
尽可能使用最精简的HTML代码
要提高页面的下载速度,降低服务器带宽的压力,需要我们尽可能地缩小页面文件的“体积”,当然,这不能以减少页面中具体内容为代价,也即是说应该在保证页面可视部分不变的前提下,尽可能使用精简的代码,减小页面HTML文件的字节数。
事实上,在HTML中同一效果的实现可以有多种不同的解决办法。比如说,如果我们需要在页面中显示“粗体”字,至少有两种方式可以实现:<strong> 标签或 <b> 标签,很显然,使用 <strong> 标签要比使用 <b> 标签多了5个字符,而如果考虑到HTML标签必须成对出现的语法,相应的 <strong></strong> 标签要比 <b></b> 多了10个字符。虽然某些HTML组织推荐使用<strong>标签,但事实上,二者毫无区别,无论在页面显示还是SEO方面,那么,为何不用效率更高的方式?
尽可能避免冗余的嵌套标签
HTML代码一个显著的特征便是其支持代码的嵌套。但由此而来的另一个问题便是,所见即所得编辑器在修改某个格式时并不会将原格式删除,而只是简单地在原代码中置入新的嵌套标签,这样不可避免地使HTML代码变得臃肿。所以,要注意页面HTML文件中冗余的嵌套代码。
比如说下文的代码:
<font face="宋体">这是</font>
<font face="宋体"><strong>粗体</strong></font>
<font face="宋体">示例</font>
这在使用所见即所得编辑器创作的网页中是极其常见的,大家可以看出这类代码的拙劣:<font>标签不断地在重复定义。类似上文的例子我们可以更有效地修改为:
<font face="宋体>这是<b>粗体</b>示例</font>
可以看出相应的代码减少了将近一半左右。
尽量使用CSS
传统上,当我们在HTML页面中定义相应的格式时需使用如字体(<font>)、段落(<p>)标签,在这些标签之间是我们的内容部分,如文本、链接、图像等。当使用所见即所得编辑器修改某一格式时,相应的新标签便会被放入页面的HTML文件中,这样,就会产生很多重复的代码。随Web技术的发展,现在我们可以通过定义样式表(CSS: Cascading Style Sheets)来实现,这样可以增强代码的复用,提高效率。
同时,CSS也可以带来其他好处,如可以作为外部文件引用,这样,会大大降低HTML页面文件的大小;而当我们需要对页面的某些格式调整时,不必一个个去改动每个页面,只需调整CSS文件即可,等等。
总之,代码也影响排名!如果你排名长期上不去,请你检查下代码问题,自身网站的问题,等等! |
|