首页 > 系统概念 > Google PR劫持以及识别方法

Google PR劫持以及识别方法

2008年7月10日 发表评论 阅读评论

一年多前曾看到一个国外网站,一共有10个页面,页面的PR值分别从1到10,当时曾惊为天人,有此深厚功力……

不久前才知什么叫难者不会,会者不难,不过是利用了常用的301和302转向而已。今天我们就来讨论一下如何进行Google PR劫持。这就像一把双刃剑,在正常SEO的人群手里,可以知道如何来识别Google PR劫持;而对于真正想作弊的人来说,不在这里也肯定能找到其他作弊的方法。和网络安全一样,如果没有人研究溢出、注入等各种安全问题,那么网络就是安全的吗?好了,不说废话了,切入正题。

Google PR是站长们都在追逐的东西,虽然不一定对排名有多大用,但是那一段工具条上的绿色,却是越长就越让人兴奋。

PageRank是Google衡量网页重要性的工具,测量值范围为从1至10分别表示某网页的重要性。在Google工具栏可以随时获得某网页的PageRank值。在这里,我们将透视PageRank的一些特殊之处,从而对其进行较为深入的了解,使大家能够更好地使用和了解Google。尽管总有Google的工作人员说Google PR “Just for fun”,但是毋庸置疑的是,高PR使得网站在搜索结果中排在前面的可能性较高。但PageRank近年来在Google排名中的重要性却是逐步下降的,甚至有人认为Google目前将其代之为TrustRank。

小知识:TrustRank即Google诚信指数,是指网站对于Google而言值得信赖的程度。网站TrustRank的计算采用人工和机器分析相结合的方式。通过Google或其他一些检索机构的专家,可以先确定一批站点的TR值,再通过机器的连接结构分析来确定互联网上其他站点TrustRank值,然后以TR值的高低来作为网页排名的一个重要依据。跟PR值原理类似,如果其他站点获得了来自高TR值站点的链接也将获得更高的TR值。Google TrustRank应该是以站点而不是页面为单位的。

尽管各种传言都指出Google PageRank马上面临退役,甚至好多人认为Google PR有可能是Google公共关系策略的一部分,也就是把网页级别当作是一个热门话题,让大家去炒,去研究,保持眼球吸引度。但是在今后的很长一段时间里,它仍然会占有相当的比重。

一般搜索引擎在处理301和302转向的时候,都是把目标URL当作实际应该收录的URL。当然也有特例,不过在大部分情况下是这样处理的。比如我们把http://www.example.com/ind…做301或者302转向到www.apple.com,那么收录的就是目标的URL,也就是www.apple.com的数据。自己网站的PR值当然没有www.apple.com的PR值高,那么Google在更新PR的时候会把你的网站的PR值用目标URL的PR值代替。这就是Google PR劫持的原理。

使用这个原理,最简单实用的作弊方法就是建立一个网站,做301或者302转向到一个PR值高的网站,等Google PR值更新之后取消转向,然后就可以Evil了,在露馅之前起码能维持一到三个月。如果广告主或者投资人不知道这些,看到你的网站拥有如此高的PR值,也许就会投资,买广告位等,但是作弊毕竟不能长久,细水长流才是真谛。

稍微复杂点的方法是通过程序检测到Google蜘蛛,对其返回301或302转向;而对普通访问者和其他蜘蛛则返回正常内容。这样我们看到的是普通网站,只有Google会看到转向。但是这样做获得高PR值的同时,牺牲的是网站的内容,因为做了301和302转向,那么搜索引擎并不会收录网站的内容,它收录的是目标网站的内容,这样通过搜索引擎就不会真正返回自己的网站内容,用户也就无法通过搜索引擎找到你。当然,你也可以只把首页做301或302转向。

要实现301或302转向,方法很简单,如果网站是PHP架构的,在页面中加入如下代码即可实现。

<?php

if (strstr($_SERVER['HTTP_USER_AGENT'], "Googlebot"))

{

header("HTTP/1.1 301");

header("Location: http://www.zol.com.cn"…

}

?>

如果Google Bot访问这个页面,这些代码将会利用301或302自动转向到www.appale.com。那么Google Bot有可能认为这个页面的PR是www.apple.com的一个镜像,所以PR值也就是www.appale.com的了。不过正如上面说的那样,现在Google Bot就没法收集自己站点的信息了。如果放在页脚的话,将会使整个站点都没办法让Google更新。不过从技巧上来讲,我们可以在骗得PR之后停止使用这个脚本。

那么我们该如何识别Google PR劫持呢?最准确的方法当然就是看Google的网页快照了,如果你看到的网页是一个样,Google快照看到的却是另外一个网站,这恐怕就非常可疑了。

由于众所周知的原因,国内无法访问Google的网页快照,这里就给大家介绍一个不用代理的访问技巧。一般Google网页快照类似以下的URL:

http://72.14.235.104/searc…

我们在“?”和“q”之间添加一个“&”,变成如下所示的URL:

http://72.14.235.104/searc…

之后就可以正常访问了。不过要注意的是,在搜索结果里不要直接点击打开网页快照,打不开之后再替换,那样替换也不能用,因为你的IP对Google的访问已经被封锁了。在搜索结果页的“网页快照”上,点右键复制URL粘贴到地址栏,然后替换,回车,OK,搞定!

虽然上面我给大家介绍了Google PR劫持的实现方法,但是我个人并不赞同作弊,毕竟作弊获得的东西不是你自己的,还是老老实实作好基本功,细水长流地好!看着自己的网站慢慢成长起来,一定会沉醉在其中的。

转载请注明:woyigui's blog [http://www.woyigui.cn/]
本文标题:Google PR劫持以及识别方法
本文地址:http://www.woyigui.cn/2008/07/10/Google-PR-hijacking/

分类: 系统概念 标签:
  1. 本文目前尚无任何评论.
  1. 本文目前尚无任何 trackbacks 和 pingbacks.
*