Search:標簽

Google搜索引擎原理概述

引項列表被存入到數據桶(Barrels)中,并生成以文檔號(docID)部分排序的 順排檔索引。索引項根據其重要程度分為兩種:當索引項中的關鍵詞出現在URL、標題、錨文本(Anchor Text)和標簽中時,表示該索引項比較重要,稱為特殊索引項(Fancy Hits);其余情況則稱為普通索引項(Plain Hits)。在系統中每個Hit用兩個字節(byte)存儲結構表示:特殊索引項用1位(bit)表示