搜索引擎將從網(wǎng)絡(luò)中抓取回來(lái)的所有資料,通過(guò)關(guān)鍵字描述等相關(guān)信息進(jìn)行分門別類整理、壓縮后,再編輯到索引里,還有一部分抓取回來(lái)經(jīng)過(guò)分析發(fā)現(xiàn)無(wú)效的信息則會(huì)被丟棄。
只有經(jīng)過(guò)編輯在索引下的信息,才能夠在搜索結(jié)果中出現(xiàn)。
最后,搜索引擎則經(jīng)過(guò)用戶輸入在最終用戶眼前的關(guān)鍵字進(jìn)行分析,為用戶找出最為接近的結(jié)果,再通過(guò)關(guān)聯(lián)度由近及遠(yuǎn)地排列下來(lái),呈現(xiàn)搜索引擎工作原理簡(jiǎn)單地說(shuō)就是:搜索引擎蜘蛛發(fā)現(xiàn)連接→根據(jù)蜘蛛的抓取策略抓取網(wǎng)頁(yè)→然后交到分析系統(tǒng)的手中→分析網(wǎng)頁(yè)→建立索引庫(kù)。
什么是搜索引擎蜘蛛,什么是爬蟲(chóng)程序?搜索引擎蜘蛛程序,其實(shí)就是搜索引擎的一個(gè)自動(dòng)應(yīng)用程序,它的作用是什么呢?其實(shí)很簡(jiǎn)單,就是在互聯(lián)網(wǎng)中瀏覽信息,然后把這些信息都抓取到搜索引擎的服務(wù)器上,建立索引庫(kù),等等,我們可以把搜索引擎蜘蛛當(dāng)作一個(gè)用戶,這個(gè)用戶來(lái)訪問(wèn)我們的網(wǎng)站,然后再把我們網(wǎng)站的內(nèi)容保存到自己的電腦上。
首先搜索引擎的蜘蛛需要去發(fā)現(xiàn)鏈接,至于怎么發(fā)現(xiàn),就是通過(guò)鏈接。
搜索引擎蜘蛛在發(fā)現(xiàn)了這個(gè)鏈接后會(huì)把這個(gè)網(wǎng)頁(yè)下載下來(lái)并且存入到臨時(shí)的庫(kù)中,當(dāng)然同時(shí)會(huì)提取這個(gè)頁(yè)面所有的鏈接,然后就是循環(huán)、反復(fù)進(jìn)行搜索。
本文內(nèi)容根據(jù)網(wǎng)絡(luò)資料整理,出于傳遞更多信息之目的,不代表金鑰匙跨境贊同其觀點(diǎn)和立場(chǎng)。
轉(zhuǎn)載請(qǐng)注明,如有侵權(quán),聯(lián)系刪除。