如果一個(gè)新手想做SEO搜索引擎優(yōu)化,當(dāng)然,他必須首先了解搜索引擎的工作原理。他不需要完全掌握它,但概念性的東西必須印在他的大腦中。至于不同的搜索引擎,它們基本上是相同的。今天我們來談?wù)劰ぷ髟?/p>
第一步:爬行
搜索引擎通過特定的常規(guī)軟件跟蹤網(wǎng)頁鏈接,從一個(gè)鏈接爬行到另一個(gè)鏈接,就像蜘蛛在蜘蛛網(wǎng)上爬行一樣,所以它被稱為“蜘蛛”和“機(jī)器人”。搜索引擎蜘蛛的爬行是按照一定的規(guī)則輸入的,它需要遵循一些命令或文件的內(nèi)容
步驟2:抓取存儲
搜索引擎通過蜘蛛跟蹤鏈接爬行到網(wǎng)頁,并將爬行數(shù)據(jù)存儲到原始頁面數(shù)據(jù)庫中。頁面數(shù)據(jù)與用戶瀏覽器獲得的HTML完全相同。搜索引擎蜘蛛在抓取頁面時(shí)也會進(jìn)行一些重復(fù)內(nèi)容檢測。一旦他們在權(quán)重較低的網(wǎng)站上遇到大量剽竊、收集或復(fù)制的內(nèi)容,他們可能會停止爬行
步驟3:預(yù)處理
搜索引擎會對蜘蛛捕獲的頁面進(jìn)行不同步驟的預(yù)處理;除了HTML文件,搜索引擎通??梢圆东@和索引各種基于文本的文件類型,如PDF、word、WPS、xls、PPT、txt文件等。我們經(jīng)常在搜索結(jié)果中看到這些文件類型。然而,搜索引擎不能處理圖片、視頻和flash等非文本內(nèi)容,也不能執(zhí)行腳本和程序
第4步:排名
用戶在搜索框中輸入關(guān)鍵字后,排名程序調(diào)用索引數(shù)據(jù)庫數(shù)據(jù)來計(jì)算排名并將其顯示給用戶。排名過程直接與用戶交互。然而,由于搜索引擎的數(shù)據(jù)量巨大,雖然每天都會有小的更新,但通常情況下,搜索引擎的排名規(guī)則會根據(jù)天、周和月在不同的范圍內(nèi)更新。