您现在的位置是:芭奇站群管理系统 > 优化技巧 > -> 刨根分析:Google 指责错了,Bing 同学可能还真不叫作弊

刨根分析:Google 指责错了,Bing 同学可能还真不叫作弊

时间:2011-02-16 12:30

  最近Google指责Bing抄袭一事炒的火热。Google先是策划好在“搜索之未来”大会前一天爆料,然后Bing第一时间回应说Google是编小说呢,然后Google官方博客向Bing开火,Bing再次不承认,同时还倒打一耙说Google也抄袭我们呢,最后MattCutts继续拿出了更多证据,甚至连讽刺电视都插一腿进来。事情已经乱套了,这事到底谁对谁错呢?SEL的主编DannySullivan来了个彻底的分析,他认为Google错怪Bing同学了,以下是长篇分析。

微软不承认抄袭了Google的搜索结果,他们一直都没承认这一点,因为他们没直接看Google同学的考卷,而是利用点击数据流改进搜索结果的,只不过点击数据流的来源有Google。Bing的集团VPHarryShum也一直坚称:

Google坚持微软利用了IE浏览器和B刨根分析:Google 指责错了,Bing 同学可能还真不叫作弊ing工具栏监视用户在Google搜索了什么,但Bing不承认他们只监视Google,他们监视的是用户在整个网络上的操作行为。Bing可以看到用户正在浏览什么,假设他们去了百度,Bing也会知道的,假设用户在百度做了搜索,Bing也会知道你搜索了什么点击了什么。其实叫点击数据流不太准确,我们暂且给它一个更准确的名字吧:冲浪数据流。

人们当然上Google的次数最多,只要他们搜索了什么,Bing就知道,帝国CMS自动采集因为只要分析一下他们进入的网页地址就成了:

当然Bing也知道用户点击了Google的哪个搜索结果──只需要记录下一个去到的那个网站的地址即可。这样做之后,Bing就知道用户针对某个搜索关键字选择了哪个最适合的搜索结果网站。

其实前面已经说了,Bing的这种冲浪数据流的分析并不只针对Google,而是所有网站,即便是在百度搜索,可能也会被Bing所知道。等于说是全天下所有搜索引擎都在帮助Bing提升搜索质量,这是一种很聪明的做法。Bing的Shum也承认这一点:

Bing承认对于那些怪异关键字的搜索,Bing收集到的冲浪数据流会导致其结果与Google的搜索结果相近。Google正是掌握了这个证据才坚称Bing抄袭了。但Bing不这么认为,他们觉得即便是Google的测试也证明了搜索信号权重不高,因为Google测试了100个关键字,只有大概9%导致Bing的搜索结果跟Google一样了。

9%确实是个不高的数字,Google方面在爆料的时候也说他们不清楚为什么Bing只有9%的结果上钩了。Bing称就是因为搜索信号这个种类的权重并不高,不会导致自己的搜索结果全盘与Google一样,Google的测试反到成了证明这一点的最好证据。

Google的故事里还说道他们不是无缘无故钓Bing上钩的,他们之前已经发现Bing越来越像自己了,非常多的首页搜索结果跟Google一模一样。

但Bing也不承认这一点。在去年10月Bing内部使用了全新的算法和称为Aether的实验系统,来测试排名的变化。这个变化让Google感到了冲浪数据流的存在。

什么叫长尾关键字实际上这是另外一个Google没清楚回答的问题,Google说他们去年5月就发现Bing开始用冲浪数据流了,但为什么直到数个月之后才发现Bing的搜索像自己?Google也不知道,可能是Bing在后来提升了冲浪数据流的权重吧。

Bing的部分搜索结果可能跟Google很像,但仅限非常少的关键字。比如咱们搜索“pontneddfechan”看看,这是南威尔士的一个小城的名字,点击可放大:

pontneddfechan绝对是个长尾的搜索关键字了吧?首先Google找到了71000个匹配结果,Bing只有9000个。然后首页10个搜索结果里,Bing只有4个跟Google重合动易站群,而仅仅有一个(雷打不动的第一位维基百科)搜索结果的排名是完全一样的。

再看看一个拼错的单词“bombilate”的搜索结果:

这是拼错的单词,Google会给出拼对的搜索结果,然后问你是不是要坚持搜索错误的拼写。而Bing呢?压根不问你,直接给出正确拼写的搜索结果,但是跟Google的结果并不一样。别忘了Google当初就是这么发现Bing在利用冲浪数据流抄袭自己的,但是在这个例子里二者的结果并不相同。

9%的上钩率,并不完全一样的长尾搜索结果,并不完全一样的错误拼写搜索结果,那么Google干嘛还要高调爆料Bing抄袭了呢?

因为Google看到了Bing改进搜索质量的方法,特别是对于不常用搜索关键字和错误拼写的搜索结果提升很明显。对Google来说,Bing全盘抄袭Google并不是最可怕的,可怕的是Bing在利用自己的办法对Google进行去粗取精的筛选。

Weitz同时也指出他不相信Google就没有使用GoogleToolbar和Chrome浏览器做着同样的勾当,以改进自己的搜索质量。其实就算Google不让Bing直接从他们那里获得冲浪数据流,他们一样有办法,因为Google的搜索引擎正在驱动着很多很多的大网站,包括ISP合作商、Ask-、大型门户网站等等,Bing大可以继续从他们那里获得数据。

Google起初的回应是说自己从未利用工具条数据来截取任何Google的搜索结果页面,是啊,他们何必要用这种绕一个大圈子的方式获得自己搜索引擎的数据呢?他们说自己的工具栏只是去测量网站速度,至于做不做其它的事情呢?这个问题自打事情爆出的第一天就抛给Google了,但至今他们仍未做出任何回复,哈?

这个事情还远远没有结束,或者说才刚刚开始。这不是一场由两家公关部门引起的争端,而是工程师在真刀真枪的进行着较量。搜索质量和搜索结果是一个搜索引擎的命根子,Google是否还在改进自己的搜索结果?Bing是不是比以前更出色了?谁又超过谁了?这才是最重要的。

报告称微软必应搜索准确率高于谷歌

微软必须还击谷歌指控的11个理由:指控的样本量...

微软谷歌口水战再升级称抄袭指控是“侮辱”

Bing承认使用第三方搜索数据但否认抄袭

微软必应搜索首席科学家跳槽至Twitter

Bing发布新版图像搜索功能

微软推卡拉OK形式中文必应词典迎合中国人口味

丰田Entune车载系统整合微软Bing搜索

必应去年11月美国搜索市场份额高达29%

微软Bing新年贺礼:免费下载一首正版音乐

2.年微软Bing在社交领域打败了谷歌