CUED-迅雷用户体验设计中心

html5的SEO探索

表哥 | 2011-08-08 | 网页重构
html5的SEO探索

HTML5普及每天都在增长。所有现代浏览器对HTML5的支持问题不大。HTML5被智能手机浏览器和越来越多的网站广泛的采用,甚至作为最优的选择。

但是,Googlebot,Bidubot等其他搜索引擎呢?可以抓取HTML5吗?引擎是否会由于HTML5这任何额外因素,在搜索结果中优先推荐您的网站吗?另一方面,少数搜索引擎会认为所有这些额外的H1标记的是垃圾网站吗?

这牵涉到搜索引擎是否正确读取内容,做出对关键字有利排名,搜索引擎是如何理解这些新代码的,它能否分析语义标记而进行相应的排名。

或许时机还不成熟,google还未准备好,百度更不用说了,因为HTML5的标记是尚未尽可能广泛使用(正确使用),现在它只是我们更好理解网站内容的手段,至少现在,不会因为您用上了HTML5取代旧代码而有所改变。

不是真的,这只是一个开始!HTML5在普及,我们更接近W3C的一个完整的规范,搜索引擎会采取更多的关注。搜索引擎优化,我也认为访问一个拥有正确编码,语义的网站总是比一个较不良的网站有优势。至少比使用算法和垃圾技术的改善搜索引擎优化来得容易吧。

最终用户优先(Priority of Constituencies)
“In case of conflict, consider users over authors over implementors over specifiers over theoretical purity.” 一旦遇到冲突,最终用户优先,其次是作者,其次是实现者,其次标准制定者,最后才是理论上的完满。

当HTML5提供了一些令用户兴奋的东西,其次产品得到更好的展现,其次我们可以放心地使用它们,其次元素被更谨慎的方式定义,嘿,最后搜索引擎也不再淡定。

HTML5虽然有了语义化结构化的标签,如果并不是很清楚这些标签的明确含义和使用方法, 这会使标签乱用更加严重到大的文档结构的混乱。也许会导致机器不能更好的理解文档含义。

这对我们重构提出了更高的要求,在接到产品的需求时要理解其内容间的联系,比如内容脱离了整体是不是还能作为一个完整的、独立的存在,这部分在页面是担任什么角色等。

嗯……迅雷看看主页,它的顶部有页眉(header),底部有页脚(footer),数个展示区域(section、article)、导航区(nav)和边栏(aside)。

HTML4图1