BT

如何利用碎片时间提升技术认知与能力? 点击获取答案

Google索引服务已覆盖JS和CSS内容,开发者应注意避免一些陷阱

| 作者 Sergio De Simone 关注 12 他的粉丝 ,译者 李彬 关注 1 他的粉丝 发布于 2014年6月18日. 估计阅读时间: 3 分钟 | 如何结合区块链技术,帮助企业降本增效?让我们深度了解几个成功的案例。

Google表示其网络爬虫Googlebot的执行和索引范围,现在将扩大到覆盖JavaScript中的部分内容。如果不将一些基本规则纳入考虑的话,这一改变将对搜索结果产生一些负面影响。

Google Webmaster Central博客上的一篇文章里,开发者Erik Hendriks和Michael Xu,以及Webmaster趋势分析师Kazushi Nagayama忠告Web开发者:在Google对Web页面进行索引的过程中,对JavaScript内容的处理方式上出现的一些变化,将对搜索结果造成负面影响。该文章还给出了一些用来避免这种情况发生的建议。

三位作者表示,当启用JavaScript的时候,“在过去几个月里,Google的索引系统对大量Web页面的渲染处理的做法,更贴近普通用户的浏览器”。这不同于Google传统上对页面进行索引的方式,也即是“只查看我们从HTTP响应体中的未经加工的文本内容,而并没有真正对其进行解释,从而获得普通浏览器运行JavaScript后看到的结果。”

他们写道,有些时候JavaScript渲染并不能得到预期的结果,“这可能会对网站的搜索结果带来负面影响”。为了避免这种情况的发生,对于潜在的问题以及围绕这些问题的可能的方案,他们给出了以下建议:

如果站点禁止访问JavaScript或CSS文件,那么Google索引系统将无法按照普通用户的方式来查看它。推荐的做法是在robots.txt中开放对JavaScript和CSS文件的访问。这与移动站点的关系尤为密切,因为JavaScript和CSS文件将允许Google算法了解该页面是针对移动端优化的。

  • Web服务器还应该能够处理针对资源的爬虫请求量,否则渲染结果或许会受到影响。
  • 过于复杂或晦涩的JavaScript代码,同样会妨碍页面渲染的完整度与准确性。
  • 有时候,JavaScript被用来从页面移除而不是添加内容,这会使得Google索引引擎无法访问被移除的内容。
  • 最后,Hendriks、Xu和Nagayama建议,让Web页面优雅降级将永远是个良好的策略。这将使目前尚不支持执行JavaScript的搜索引擎能够访问其内容。

Google正在开发一件工具——预计在近期发布——用来帮助网管们更好地理解Googlebot如何渲染JavaScript和CSS内容。

查看英文原文:Google Is Now Indexing JavaScript and CSS Content: Pitfalls to Avoid

评价本文

专业度
风格

您好,朋友!

您需要 注册一个InfoQ账号 或者 才能进行评论。在您完成注册后还需要进行一些设置。

获得来自InfoQ的更多体验。

告诉我们您的想法

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我

好强大 by SU苏 信东

又把其他搜索引擎追赶的距离拉大了。

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我

1 讨论

登陆InfoQ,与你最关心的话题互动。


找回密码....

Follow

关注你最喜爱的话题和作者

快速浏览网站内你所感兴趣话题的精选内容。

Like

内容自由定制

选择想要阅读的主题和喜爱的作者定制自己的新闻源。

Notifications

获取更新

设置通知机制以获取内容更新对您而言是否重要

BT