您现在的位置是:芭奇站群管理系统 > 经验心得 > -> 对话索引团队的软件工程师:谷歌是如何对待flash文件

对话索引团队的软件工程师:谷歌是如何对待flash文件

时间:2010-06-15 00:32

  ronadler和janisstipins是某索引团队的软件工程师,下面他们将就flash文件索引seo编制上取得的改进与大家进行更深入的探讨和交流。

  问1:目前哪些flash文件能更好地被谷歌索引到呢?

  答:我们改善了对所有类型swf文件中的文字内容的索引能力,其中包括像按钮或菜单这样的flash“小工具”,独立自成一体的flash网站,以及所有介于两者之间的flash形式。

  问2:这些flash文件中的哪些内容能被谷歌更好地索引呢?

  答:用户在与您的flash文件互动过程中所看到的一切文本内容都将得到更好地索引。如果您的网站包含flash,其中的文字内容会被google用来生成您网站的摘要。同时,出现在flash文件中的文字可以用来匹配用户在google搜索框中输入的搜索查询。

  除了索引flash文件中的文本内容,我们现在也能够识别在flash文件中的出现的url,并且把这些链接纳入搜索引擎机器人爬行的目标队列中,就像对待那些非flash网页中出现的url一样。例如,如果您的flash应用程序中包含指向您网站内部页面的链接,google现在能够更好地发现并抓取您的网站。

  问3:那么flash文件中包含的非文本内容呢,比如图片?

  目前,我们只能识别和索引flash文件中的文本内容。如果您的flash文件里只有图片,我们将不能识别和索引出现在这些图片中的任何文字。类似地,如果一个flash按钮没有任何附属的文字的话,我们将无法对这类指向特定链接的flash按钮生成任何錨文本。

  还应注意到的是,我们无法索引flv文件,比如在youtube上播放的视频,因为这些文件没有包含任何文字元素。

  问4:google是怎样识别flash文件里的内容呢?

  答:我们开发出了一种算法,这种算法可以使google机器人能够模仿人类通过点击按钮、输入内容等方式来了解flash文件。我们的算法能够记住沿途它遇到的所有文字内容,其后这些内容都能被索引到。我们无法告诉您更多的保密细节,但是我们可以告诉您,通过使用adobe的新型可检索性swf数据库,这种算法的有效性得到了进一步提高。

  问5:我在对flash做seo时,怎样才能使google索引到我的flash文件中出现的文本呢?

  基本上,您不需要做任何事情。我们已经取得的技术改进,使这项功能的实现,无需网页设计者或网站管理员做任何特别的操作。如果您的网站上有flash内容,我们会在现有技术能力的基础上,尽最大能力对它们自动进行索引(详见接下来的问题)。

  也就是说,您应该了解google现在已经可以识别那些展现在您网站访问者面前的文字信息。如果你希望google忽略一些次要内容,如“版权”或“加载”等信息,您可以考虑把那些文本替换为图片,这样它们就不会被我们抓取到了。

  另外,谷歌在抓取flash文件的最新表现:

  当一个swf文件从其他的文件里加载text,html,xml和其他swf等文件内容的时候,gg同时也能索引这些外部的连接的内容,并且把它与原来的swf文件与引用了这些内容的文件相关联起来。目前gg在网站上碰到swf文件时可以索引以下5点:

  a.支持通用的flash文件中内嵌的javascript技术,比如swfobject和swfobject2。

  b.索引采用as1和as2脚本的站点,即使actionscript是模糊的。2009年6月19日最新更新:现在我们也能索引采用as3的脚本。

  actionscript的版本在索引过程中不是特别有相关性,因此我们不仅支持新版本的as,同时也支持老版本的as。

  c.识别flash文件中的链接。

  d.加载外部资源,并把这些内容跟母文件联系起来。

  e.索引那些作为用户和这个文件交互时才显示的文字性内容。我们能够点击swf文件中的按钮并输入内容,就像一个用户做的那样。

  假如你不想让gg索引到flash里的内容或者连接的话你可以用robots.txt进步屏弊。

  在搜索引擎技术上这无非是一个重要的进步,但对于一般的seo站长来说一般用不着这个,如果你的网站上有flash的话也可以进行seo,哪怕是一个小的flash导航。

  以上内容由神话深圳seo工作室整理提供