2015年9月23日 星期三

搜尋引擎具特色的演算法-TrustRank演算法

3.TrustRank演算法:

TrustRank演算法認為,用某網頁與可信任網頁之間的連結關係和傳播深度來計算網頁間信任程度的演算法。可知信任度越高,權重越大。

TrustRank演算法主要兩個工作流程:

1.可信任網頁集合篩選:TrustRank演算法通過人工審核來判斷某個網頁是否屬於可信任網頁,將其網頁加入可信任網頁集合中(屬網頁白名單)。由於存在海量網頁所以,實際會先通過相應的演算法進行預先過濾,再對符合條件網頁進行人工篩選。

2.網頁信任值的傳播計算:這會涉及兩方面問題。
  • 可信任網頁外出連結數量:一個可信任網頁外出連結數量越多,被連結的網頁得到的信任值就會越小。例:某一可信任網頁的信任值是100,它存在10個外出連結,如果被指向的網頁對信任值進行平均分配,則每個網頁的信任值就是10。
  • 網頁與可信任網頁之間的連結深度:TrustRank演算法會計算存在網頁間的直接連結關係、間接連結關係。

網頁A→網頁B→網頁C

說明:A是可信任網頁,A與B存在直接連結關係,B與C存在直接連結關係,C與A存在間接連結關係。網頁與可信任之間連結距離越大,可信任度越小,最後當然權重也就越低。


目的:實作上盡量讓網頁和可信任網頁連結距離近點!




每天學一點快樂輕鬆學~

「往上走的人沒時間往後看,因為你不會發現你們正在拉開差距。」

沒有留言:

張貼留言