谷歌算法是如何在索引數(shù)據(jù)庫中檢索相符的內(nèi)容
正確判斷出用戶的搜索意圖之后,谷歌的排名算法就要為該搜索意圖檢索配對的信息了。
在基本層面上,谷歌算法以關(guān)鍵詞的匹配為核心出發(fā)點(diǎn)進(jìn)行信息檢索。
檢索信息這里涉及精準(zhǔn)匹配和寬泛匹配兩種內(nèi)容配對行為,算法會分析相關(guān)關(guān)鍵詞在某個頁面上出現(xiàn)的頻率和位置。
(注意:出現(xiàn)在標(biāo)題中和出現(xiàn)在普通段落中參與計算的相關(guān)性權(quán)重是有區(qū)別的。
)要引起重視的是,與用戶搜索相符的關(guān)鍵詞在一個頁面中出現(xiàn)的次數(shù)并不是越多越好。
因為這里涉及關(guān)鍵詞堆砌的問題,相關(guān)關(guān)鍵詞在同一個頁面中出現(xiàn),雖然與用戶使用的搜索關(guān)鍵詞不能完全匹配,甚至不包含用戶使用的任何關(guān)鍵詞,也毫不影響其對焦點(diǎn)關(guān)鍵詞排名的推動作用。
比如,用戶還是使用關(guān)鍵詞“我和我的祖國”進(jìn)行搜索,這時有一個新的頁面,它的內(nèi)容中包含了很多其他的相關(guān)關(guān)鍵詞,如“張藜作詞”“秦詠誠作曲”“李谷一原唱”“愛國主義歌曲”“一刻也不能分割”等。
谷歌算法知道這個頁面是關(guān)于《我和我的祖國》這首歌曲的,而不是關(guān)于電影的。
除了相關(guān)關(guān)鍵詞的輔助判斷外,谷歌還使用經(jīng)過匯總和匿名化處理的互動數(shù)據(jù)來評估結(jié)果算法與查詢內(nèi)容的相關(guān)。
谷歌將這些數(shù)據(jù)轉(zhuǎn)換為修正信號,協(xié)助谷歌的算法系統(tǒng)評估相關(guān)性。
此外,谷歌的排名算法還會根據(jù)其他線索來衡量潛在的搜索結(jié)果在多大程度上滿足用戶的搜索需求(這一點(diǎn)比上面說的修正信號更加重要 )。
因為頁面上的內(nèi)容并不是只有文字,還可能有圖片、視頻、音頻等。
這些內(nèi)容的存在也是谷歌算法需要重點(diǎn)考慮的因素,如圖片的Alt屬性,它就是為谷歌判斷圖片的主要表達(dá)內(nèi)容而存在的。
最后,用戶瀏覽器使用的語言也非常重要,谷歌算法會檢索數(shù)據(jù)庫中頁面內(nèi)容的文字語言與用戶當(dāng)前瀏覽器所使用的語言是否一致,以便優(yōu)先為用戶提供其首選語言的網(wǎng)頁內(nèi)容。
本文內(nèi)容根據(jù)網(wǎng)絡(luò)資料整理,出于傳遞更多信息之目的,不代表金鑰匙跨境贊同其觀點(diǎn)和立場。
轉(zhuǎn)載請注明,如有侵權(quán),聯(lián)系刪除。