2015年8月17日 星期一

搜尋引擎抓取策略-頁面抓取方式-高權重優先

搜尋引擎抓取策略


高權重優先

"權重"就是搜尋引擎對網頁重要性的一種評價,評價愈高相對網站資訊價值愈高愈重要。


高權重優先是對URL資源列表中的高權重網頁進行優先抓取策略,而網頁權重高低往往都是很多因素影響決定的,如常用的Google PageRank(俗稱PR值)就很多影響因素。例如:網頁的外部連結數量及品質‧‧‧等等。還有如果下載一個URL就重新計算所有已下載URL資源的權重,這樣效率非常低,搜尋引擎會傾向每下載若干個URL資源後就對已下載URL進行權重計算,以此來確定這些URL相對應的權重值,權重較高優先抓取。


權重計算是基於部分資料得到的結果,可能也會和真實權重有出入。因此也可能對次要頁面進行優先抓取。


目的:要知道權重也是參考部分質料所得的值,所以要得到好的權重必須逐步修正。
           得到高權重網站相對重要較容易被找到、不易被除去。





每天學一點快樂輕鬆學~

「往上走的人沒時間往後看,因為你不會發現你們正在拉開差距。」

沒有留言:

張貼留言