谷歌的Pagerank算法的簡單分析_SEO優(yōu)化教程
推薦:李衍民:江湖失傳的28個SEO秘籍門戶網(wǎng)站已經(jīng)成為企業(yè)建設中不可缺少的一部分,網(wǎng)站成為行業(yè)競爭中新的利器。如今,企業(yè)之間的行業(yè)競爭在現(xiàn)實中表現(xiàn)的十分殘酷,同理企業(yè)的網(wǎng)絡競爭也越發(fā)激烈。那么,企業(yè)
搜索引擎的算法一直以來都是最核心的運營機密,很多SEO優(yōu)化工作者也都是對搜索引擎算法停留在了解原理的基礎之上,我們能做的就是在每一次搜索引擎更新算法的時候依據(jù)大量網(wǎng)站的搜索情況進行猜測。一個真正了解搜索引擎的SEO從業(yè)人員勢必會讓自己在優(yōu)化的道路上左右逢源,為了更好的和搜索引擎對話,為了能夠更好的對網(wǎng)站進行改善優(yōu)化,SEO優(yōu)化聯(lián)盟建議大家要認認真真的去了解搜索引擎算法的工作原理并按照算法的特點來有針對的進行優(yōu)化工作。
搜索引擎算法的存在一方面是為了能夠為用戶提供更準確的搜索結(jié)果,另一方面就是為了使SEO優(yōu)化行業(yè)更加規(guī)范,避免那些使用作弊手段來欺騙搜索引擎的網(wǎng)站優(yōu)化方法。算法最終目的是為了在用戶使用搜索引擎搜索關鍵詞的時候能夠?qū)⑴c查詢主題高度相關的一些網(wǎng)頁集合展現(xiàn)出來,而目前基于查詢的分析算法中主要分為兩個大類,一個是谷歌的基于鏈接分析的Pagerank算法,另一個就是基于查詢主題進行分析的Hits算法,這兩種算法是目前搜索引擎使用最為廣泛的算法,這兩種算法各有各的特點,也各有各的缺點不足,那么作為SEO從業(yè)者我們該如何正確的去學習這兩種算法來為自己的工作做準備呢?也許你會一臉茫然,但是你會在這篇文章中更好的對著兩種算法進行了解。
谷歌的Pagerank算法的簡單分析
1、Pagerank算法的核心思想:
注意谷歌Pagerank算法是基于隨機沖浪模型的最好典范(指的是該算法使用的前提是用戶訪問網(wǎng)頁時隨機的),谷歌的Pagerank算法的最基本思想是基于網(wǎng)站之間的相互投票,即我們常說的網(wǎng)站之間互相指向,如果判斷一個網(wǎng)站是高質(zhì)量站點時,那么該網(wǎng)站應該是被很多高質(zhì)量的網(wǎng)站引用又或者是該網(wǎng)站引用了大量的高質(zhì)量權(quán)威的站點,也就如下圖卡通形象所示,所
以對于谷歌來說,我們在優(yōu)化的時候就應該將該算法的核心思想運用得當,在優(yōu)化的時候我們嘗試將自己的站點和高質(zhì)量的權(quán)威網(wǎng)站進行鏈接,抑或是通過自己的關
系讓自己的站點被一些高權(quán)重的站點鏈接上去,這樣一來,無論是在谷歌還是在百度搜索引擎中,我們的站點在他們看來也會是具有高質(zhì)量的站點。所以SEO優(yōu)化
聯(lián)盟建議大家在針對谷歌優(yōu)化的時候要盡力的建設好網(wǎng)站的外鏈和內(nèi)部鏈接,用鏈接來增加網(wǎng)站或者是網(wǎng)站內(nèi)容頁面的投票數(shù),進而增加相關重要網(wǎng)頁的權(quán)重。

2、Pagerank算法的計算要素:
pagerank算法的計算方法是基于一個與當前網(wǎng)站頁面相關的所有網(wǎng)頁集合(主要是指該網(wǎng)頁
指向和被指向的網(wǎng)頁集合),也就是說將該網(wǎng)頁置身與一個比較大的方陣之中,在這個方陣之后網(wǎng)頁與網(wǎng)頁之間是通過互相指向的有向圖來確定關系同時進行網(wǎng)頁
PR值的傳遞,假如網(wǎng)也的PR值為1那么相對于整體來說該頁上從其他特定網(wǎng)頁上繼承過來的權(quán)重應該是PR(t)/L(t)[其中PR(t)指的是特定網(wǎng)頁的pr值,L(t)指的是該網(wǎng)頁的出站鏈接數(shù)目],
但是我們知道這是理想狀態(tài)下的計算方法,一個網(wǎng)頁上影響pr值的還有很多噪點,比如網(wǎng)頁中的廣告鏈接、網(wǎng)站之間相互鏈接的連接點是不能再此時同時計算出去
的,也就是說該算法還需呀一個規(guī)范化的因子來糾正結(jié)果的正確性(規(guī)范化因子我們命名為d,通常d值取值為0.85)所以實際上谷歌Pagerank算法用
來計算網(wǎng)站權(quán)重的計算公式應該是一個拋去其他噪點因素的干凈公式:
PR(A)=(1-d)+d[PR(t)/C(t1)+...+PR(tn)/C(tn)]
從公式中我們還可以看到一個很令人困惑的問題,那就是該公式中并沒有將相互鏈接的網(wǎng)站或者是形成閉環(huán)的網(wǎng)頁鏈接(類似站群思想,將網(wǎng)頁之間形成閉環(huán)來積累PR值)
拿出來單獨解釋,對于相互之間互相鏈接的網(wǎng)站我們通過分析可以知道,二者之間的pr值如果在沒有出站鏈接的情況下只會互相傳遞,不會向外流失,久而久之
pr值就會慢慢積累越來越高,這對搜索引擎來說是不夠友好的,所以在實際的pagerank算法中在計算的過程中是將這種閉環(huán)鏈接單獨進行計算,同時也引
入了衰退因子(下文中的E(U)),防止pr值過多的積累,該算法的結(jié)構(gòu)如下:

所以對這部分的權(quán)重計算公式可以簡單的列舉如下:

主要思想就是該部分網(wǎng)頁的權(quán)重R'(u)等于相互鏈接的網(wǎng)頁pr值R(v)與網(wǎng)站的出戰(zhàn)鏈接數(shù)目N(v)進行迭代計算,同時引入衰退因子E(U)來現(xiàn)在權(quán)重的積累。
3、Pagerank算法的優(yōu)缺點分析:
pagerank算法將互聯(lián)網(wǎng)中大多數(shù)的網(wǎng)頁通過基于鏈接來計算網(wǎng)頁質(zhì)量的方式進行排名,為搜索引擎用戶提供較好的基于鏈接查詢的搜索結(jié)果,同時該算法能夠進行離線分析處理,大大縮短了搜索引擎用戶的服務響應時間,因此就目前來說該算法是搜索引擎應用最好的算法,但是pagerank算法的缺點也是相當明顯的,在上文中我們也進行了討論,那就是該算法在初期的時候一直都是基于鏈接分析的,而一個網(wǎng)頁上的鏈接包含很多:比如廣告鏈接、功能鏈接、導航鏈接、以及多次重復的無效鏈接等等,這些鏈接都會被該算法計算在pr值傳遞之中,所以不能夠?qū)W(wǎng)頁降噪之后在進行處理,同時,由于是基于鏈接分析,導致pagerank算法計算出來的搜索結(jié)果往往會偏離實際的搜索主題,也就是說該算法不能很好的基于主題查詢,當我們在進行查詢的時候,pagerank算法會自動將計算出來的主題相關網(wǎng)頁連接到的不相關頁面也集中起來,這就導致該出現(xiàn)的重要網(wǎng)頁沒有出現(xiàn),而不該出現(xiàn)的與主題不相關的頁面卻出現(xiàn)了,這對整個用戶來說都是不合理的。
以上是自己對谷歌搜索引擎Pagerank算法的一些簡單認識,在實際操作過程中SEO優(yōu)化聯(lián)盟肯定會存在很多的不足以及錯誤,如果細心的你發(fā)現(xiàn)了,請你及時的和我聯(lián)系。
本文來源:http://www.seow3c.com/轉(zhuǎn)載請注明出處!
分享:干貨推薦:網(wǎng)站降權(quán)怎么恢復!最近我們的百度大人有點興奮,不得不說這是一件好事,對于我們新手SEO來說,可以多學習一點東西了,僅僅是對于新手而言的,對于老人們就是苦不堪言�。“俣�3.15、4.4這兩天
- 相關鏈接:
- 教程說明:
SEO優(yōu)化教程-谷歌的Pagerank算法的簡單分析
。