搜索引擎是指使用特定的計算機(jī)程序,根據(jù)一定的策略從互聯(lián)網(wǎng)上收集信息。在組織和處理信息后,它為用戶提供檢索服務(wù),并將用戶檢索到的相關(guān)信息顯示給用戶。搜索引擎包括全文索引、目錄索引、元搜索引擎、垂直搜索引擎、集合搜索引擎、門戶搜索引擎和自由鏈接列表
搜索引擎的發(fā)展過程
第一代搜索引擎于1994年左右出現(xiàn),以alavista、Yahoo和ifoseek為代表。它注重反饋結(jié)果的數(shù)量,主要以“完美”為特征。它主要依靠人工對分類目錄搜索進(jìn)行排序。通常,網(wǎng)頁制作人會創(chuàng)建自己的網(wǎng)站名稱和網(wǎng)站內(nèi)容文本摘要,并將其添加到搜索引擎數(shù)據(jù)庫中。搜索引擎根據(jù)預(yù)設(shè)規(guī)則匹配、排序和顯示用戶輸入的信息。這種方法只能進(jìn)行簡單的字符串匹配,不能進(jìn)行全文搜索
第二代搜索引擎使用基于超鏈接分析的機(jī)器捕獲技術(shù)。搜索引擎使用一個程序在網(wǎng)絡(luò)上檢索數(shù)據(jù),并將結(jié)果自動存儲在索引數(shù)據(jù)庫中。搜索引擎匹配、排序并顯示用戶類型的信息。1998年,以谷歌和directhit為代表的第二代搜索引擎出現(xiàn)在互聯(lián)網(wǎng)上。這些發(fā)動機(jī)的主要特點是提高精度。他們可以用“精致”來描述它的優(yōu)勢。網(wǎng)站制作人不需要單獨輸入搜索信息。理論上,任何網(wǎng)站的所有頁面都可以添加到其數(shù)據(jù)庫中。第二代搜索引擎的大多數(shù)查詢將返回數(shù)萬條信息。查詢結(jié)果中存在過多的無關(guān)信息,查詢結(jié)果的顯示混亂。用戶仍然很難找到他們真正想要的數(shù)據(jù)
第三代搜索引擎是第二代搜索引擎的改進(jìn)。與前兩代相比,它更加注重用戶的智能化和個性化,從而為用戶使用搜索引擎獲取信息獲得更好的體驗。