
什麼是 PageRank?
PageRank 是 Google 早期使用的一種核心演算法,用來評估網頁的重要性並影響其在搜尋結果中的排名。這個演算法由 Google 的共同創辦人 Larry Page(名字正巧也是 PageRank 名稱的由來)和 Sergey Brin 在 1997 年於史丹佛大學研發。簡單來說,PageRank 透過計算連結的數量和品質來估計網頁的重要程度:如果許多高品質網站都連結到你的頁面,你的頁面就被視為更重要,排名也可能更高。
你可以把 PageRank 想像成網際網路世界的「投票機制」。每一個連結就像是一張投票票券——當其他網站連結到你的頁面時,就等於投了一票給你。而且不只是票數多就好,票的品質同樣重要:一個來自權威網站的連結所傳遞的權重,遠遠高於一連串不知名小網站的連結。這有點類似學術論文的引用次數:被知名期刊引用越多的論文通常越有影響力;同樣地,被高權威網站連結的頁面,在 Google 看來也更具權威性。不同的是,PageRank 還會考量「引用者的權威」,也就是說來自重要網站的一票比普通網站的一票含金量更高。
舉個例子,如果你的網頁討論某個主題,並且獲得了像 Wikipedia 或 Google 官方部落格這樣權威網站的連結引用,Google 會認為你的內容具備一定的可信度和價值,因而可能給予更高的排名。相反地,如果你的頁面沒有任何其他網站連結,Google 就只能根據內容本身來評估其相關性與品質,在缺乏外部投票的情況下,通常難以在激烈的排名競爭中勝出。
PageRank 的運作原理
了解了概念後,我們更深入來看看 PageRank 演算法背後的原理。當年 Larry Page 和 Sergey Brin 發表的原始論文中,將整個網際網路視為一個巨大的連結圖譜。每個網頁都是這張網路圖上的一個「節點」,而節點之間的連結就是「邊」。PageRank 透過反覆迭代計算這張圖中所有節點的「分數」,找出哪一些頁面因為被很多重要頁面所連結,而累積了較高的權重。
簡化來說,PageRank 的計算可以用下面的想法來描述:
初始分數:假設整個網路上一共有 $N$ 個網頁,一開始每個頁面的 PageRank 分數都相同,約為 $1/N$(可以理解為隨機網路衝浪者有等機率造訪任一頁面)。
投票傳遞:接著,每個頁面會將自己的分數透過外部連結傳遞出去。如果頁面 A 有 10 分的權重,且它有 5 個外部連結,那麼理論上每個連結可以從 A 獲得 2 分的貢獻(A 的分數平均分給所連出的每個頁面)。
迭代更新:所有頁面根據來自其他頁面的「投票」累積新分數。重複多次迭代後,各頁面的 PageRank 分數會逐漸收斂至一個穩定值。
阻尼因子:為了模擬使用者不斷點擊連結和隨機跳轉的行為,引入一個稱為 damping factor(阻尼因子,通常設為 0.85)的常數。阻尼因子意味著網路衝浪者有 85% 的機率沿著連結繼續瀏覽下去,但也有 15% 機率會隨機跳到任何一個新頁面。不管一個頁面多「孤立」,這 15% 的隨機跳轉機制都確保它至少會有一點基本分數。所以最終的公式包含兩部分:一部分是從其他頁面傳來的分數加總,另一部分是 $(1-d)$ 附加的基本分數。
上述原理聽起來有點抽象,我們可以用一個比喻來幫助理解:想像一位永不停歇的「隨機衝浪者」在網路上亂點連結。Ta 起初平等地可能造訪任何網站,然後每當點進一個網頁,又會隨機點擊該頁面上的連結跳轉到下一個網頁。大部分時候 Ta 都遵循連結在網上漫遊,但偶爾也心血來潮,直接在瀏覽器輸入網址跳到一個全新網站。PageRank 算法就是計算這位隨機衝浪者長期下來停留在各個頁面的概率。某個頁面如果獲得較高的概率,表示衝浪者很常透過各種連結路徑跑到這裡來,那這個頁面就被認為較有權威、值得在搜尋結果中給予較高排名。
Python 範例:模擬簡單的 PageRank 計算
理解理論之後,我們來試試一個小範例。假設我們有一個只有四個網頁的小型網路 A、B、C、D,它們之間的連結關係如下:
- A 網頁有連結到 B 和 C
- B 網頁有連結到 C
- C 網頁有連結到 A
- D 網頁沒有連出任何連結(孤立頁面)
我們預期:C 可能是個「明星頁面」,因為 A 和 B 都連到 C;相反 D 沒有任何其他頁面連到它,是個「孤島頁面」,重要性或權重應該最低。我們將用 Python 內建的網路分析套件 NetworkX 來模擬這個連結圖譜並計算 PageRank 分數。以下是示範程式碼:
import networkx as nx
# 建立一個有向圖並加入節點關係
G = nx.DiGraph()
G.add_edges_from([
("A", "B"), # A -> B
("A", "C"), # A -> C
("B", "C"), # B -> C
("C", "A") # C -> A
# D 沒有對外連結,我們稍後會自動包含節點 D
])
# 確保將 D 節點加入圖中(即使沒有邊)
G.add_node("D")
# 計算 PageRank 分數
pr = nx.pagerank(G, alpha=0.85)
print(pr)
在上面的程式中,我們創建了一個有向圖 G,加入了 A、B、C、D 四個節點和指定的連結邊關係。接著使用 nx.pagerank 函式計算 PageRank(其中參數 alpha=0.85 就是阻尼因子 $d=0.85$)。最後我們列印出各節點的 PageRank 分數 (pr)。
執行這段程式碼,印出的結果(經過四捨五入)大致如下:
{'A': 0.37, 'B': 0.20, 'C': 0.38, 'D': 0.05}
上圖:範例網頁 A、B、C、D 之間的連結關係圖,及其經過演算法計算後的 PageRank 分數。可以看到 C 頁面的 PageRank 最高 (約 0.38),因為它同時獲得 A 和 B 的連結「投票」。A 頁面也有不錯的分數 (0.37),因為得到了來自 C 的重要投票。B 頁面的分數較低 (0.20),因為只有 A 連結到它,而且 A 的「票」還同時分給了 C。D 頁面幾乎沒有其他頁面的投票,只保有基本分數,因此權重最低 (0.05)。
這個簡單例子印證了我們對 PageRank 機制的預期:有越多重要頁面連結指向的頁面,PageRank 會越高;而缺乏連入連結的頁面(像例子裡的 D),權重幾乎只剩下演算法分配給每個頁面的最低保障值。
PageRank 如何影響 Google 搜尋結果排名
了解 PageRank 後,一個自然而然的問題是:這個演算法實際上如何影響 Google 的搜尋排名呢? 簡單來說,PageRank 曾經是(並且在某種程度上仍然是)Google 排名演算法的基石之一。Google 創立之初,就以 PageRank 為核心來決定搜尋結果的排序,這也是當年 Google 搜尋品質超越其他搜尋引擎的一大原因——它巧妙地利用了整個網際網路的連結關係作為衡量依據。
在 PageRank 問世之前,搜尋引擎主要依賴網頁內容本身(例如關鍵字出現頻率)來判斷相關性,而 PageRank 增添了一種全新的衡量維度:「這個網頁是否被其他值得信賴的網頁所推薦」。結果證明,這種以連結投票為基礎的權威評估大幅提升了搜尋結果的品質和相關性。因此,在 Google 的排名算法中,連結品質和數量(也就是 PageRank 的體現)成為影響排名的重要因素。
Moz 的一項研究顯示,PageRank 較高的頁面往往能在搜尋引擎結果頁(SERP)中獲得較好的排名表現。換句話說,從整體趨勢上看,如果你擁有許多高品質外部連結,使你的頁面PageRank累積得比較高,那你的頁面通常比較有機會在搜尋結果中名列前茅。這也是為什麼 SEO 專家長期以來非常重視鏈接建設(Link Building)的原因:透過爭取其他權威網站的連結,可以有效提升你的網站在 Google 眼中的信譽度和權重。
然而,值得注意的是,PageRank 並非決定排名的唯一因素。Google 的搜尋演算法經過多年演進,現在考量了數百種不同的排名訊號。正如 Google 官方所說:「雖然 PageRank 是 Google 基本演算法之一,但 Google 搜尋遠不只靠連結,PageRank 只是眾多排名信號之一而已。」也就是說,一個頁面要在搜尋結果中勝出,內容的相關性、品質、使用者體驗等其他因素也同樣重要。但即便如此,PageRank 代表的連結權威性依然是底層的重要考量。Google 在 2023 年底公佈的搜尋排名系統指南中明確指出:PageRank 仍然屬於核心排名系統的一部分,只不過相比 1998 年剛推出時已經「演化了許多」。甚至在 Google 專門討論網路資訊可信度的文件中也提到:「用來評估網頁可信度和權威性的訊號中,最知名的就是 PageRank,它透過網頁上的連結來理解權威性。」可見PageRank 雖已「隱身幕後」,但依然在持續發揮作用。
PageRank 的現在:工具列消失了,但影響依然存在
如果你是多年前就接觸 SEO 的讀者,可能還記得曾經有一個「Google 工具列 PageRank」分數(0 到 10 分)公開可見的年代。我們過去可以透過瀏覽器工具或第三方網站,查詢任何一個網頁的 PageRank 分數,這在當時成為衡量網站權重的指標。然而,Google 在 2016 年時關閉了公開的 PageRank 查詢接口,從此我們就無法再得知每個頁面的 PageRank 數值了。這個改變一方面是因為 Google 不希望站長過度迷信單一分數、操弄連結來提升 PageRank,另一方面也是因應演算法的演進,Google 希望大家把重心放在整體網站品質上,而非只追求一個數值。
那麼,沒有公開分數之後,PageRank 是否就此失去作用了呢? 並不是。Google 雖然不再公佈 PageRank 值,但多位搜尋團隊成員都陸續證實:PageRank 演算法本身依然在 Google 排序系統中運行。例如,Google 資深分析師 John Mueller 在 2021 年的一次線上問答中強調:「內部連結對 SEO 非常關鍵,因為它們可以幫助引導 Google 和用戶了解哪些頁面重要。而這背後的原因,就在於內部連結會影響 PageRank 在整站的流動分布。」他還特別提到:「儘管 PageRank 工具列消失了,但我們依然有在使用 PageRank 作為排名訊號之一。」再比如,Google 資深工程師 Gary Illyes 曾在 2017 年於推特上表示:「你知道嗎?Google 在經過 18 年後,我們仍然在排名中使用 PageRank(以及其他數百項訊號)。」。這些都證實了 PageRank 作為演算法的影響力依然長存,只是我們無法直接看到它的分數而已。
對於 SEO 初學者而言,這段歷史演變透露出一個重要訊息:不要執著於追逐 PageRank 表面的分數,而要專注於其背後代表的價值。也就是說,專注於打造高品質內容並獲得真實且相關的高品質連結,PageRank 自然會隨之提升,Google 排名也就有更大機會改善。
提升 PageRank:實務上的建議
既然 PageRank 的本質是透過連結來評估網頁權威性,那在實務上,提升 PageRank 無非就是兩件事:
爭取更多的連結(尤其是高品質連結):這包括透過優質內容吸引自然的引用、分享,或者主動進行內容行銷、社群經營來提高能見度。當其他網站願意連結到你的內容時,就等於在告訴搜尋引擎「這裡有值得推薦的資訊」。特別是來自權威網站或相關性高的網站的背鏈(backlink),對你的 PageRank 助益最大。反之,一堆低品質、不相關的連結即使數量很多,增益也有限,甚至可能被 Google 視為刻意操弄。
優化內部連結結構:不要忘了,PageRank 不僅適用於外部連結,內部連結同樣會影響。合理地在你網站內部建立頁面之間的連結,可以幫助重要頁面得到更多權重傳遞。Google 的建議是確保網站有清晰的架構層次,重要的內容彼此串聯,讓搜尋引擎能夠順暢地抓取並傳遞權重。同時,內部連結也提升了使用者體驗,因為讀者可以方便地從一篇文章跳轉到相關主題。
需要特別強調的是,切勿嘗試作弊或操縱 PageRank。早年的 SEO 黑帽技巧之一是所謂的「PageRank 雕刻」(PageRank Sculpting),例如大量建立隱藏連結、購買連結,或者使用黑網路聯盟互相堆砌連結等等,希望人為地提升某頁的 PageRank。現在這些做法不但效果有限,還很容易受到 Google 漏洞演算法或人工處分的懲罰。Google 明確指出:任何試圖操縱 PageRank 或排名的連結行為都屬於違反指南的「連結方案」,可能導致網站排名下降甚至被移除索引。因此,正規的做法應該是把心力放在內容和使用者身上——創造有價值的內容來自然吸引連結,而非鋌而走險地購買或黑手連結。
結語:從 PageRank 學到的 SEO 心法
對於 SEO 新手來說,PageRank 是一個絕佳的切入點,讓我們明白 Google 排名的關鍵原理之一:連結即代表信任與推薦。透過 PageRank 的學習,我們得到幾點寶貴的心得:
內容為王,但酒香也怕巷子深:優質內容是排名的基礎,但如果沒有人連結和分享,你的內容再好也可能埋沒在角落。PageRank 告訴我們,網路上的推薦(連結)會為好內容帶來額外的加分。
重質不重量:一個高品質的連結勝過十個隨便來的連結。專注於爭取權威網站、相關領域的背鏈,而不是追求連結數量的堆砌。
布局內部連結,善用網站權重:別浪費你網站內已有的權重資源。透過良好的內部連結策略,將 PageRank「汁液」引導到你最重視的頁面上,提升整體SEO效率。
演算法在變,原理不變:搜尋演算法日新月異,但「透過可信任的推薦來評價內容品質」這一核心思想從未過時。PageRank 從 1998 年一路走來,即使表面上看不見了,背後的理念早已融入了各種排名機制中。
最後,記住 SEO 是一門綜合藝術。PageRank 給了我們理解搜尋引擎的一把鑰匙,但還有許多門等著我們去開啟。對初學者而言,不需要鉅細靡遺地鑽研複雜的數學公式,重要的是領悟 PageRank 背後傳達的觀念:在網路世界中,做好內容、建立信譽,自然會得到他人的推薦與背書。當你專注於為使用者創造價值時,PageRank 也會悄悄地為你加分,讓你的優質內容在 Google 搜尋結果中脫穎而出。祝你在 SEO 旅程中一路順利,用正確的方法提升排名!