1、收錄頁(yè)面:
一般收錄頁(yè)面需要有百度蜘蛛抓取完成,通過(guò)抓取算法來(lái)決定收錄那些頁(yè)面,在百度的算法調(diào)整后,對(duì)于偽原創(chuàng)、采集站點(diǎn)予以強(qiáng)烈的打擊,所以百度在收錄頁(yè)面方面變得更加的嚴(yán)格了,高質(zhì)量?jī)?nèi)容頁(yè)面以及權(quán)重高的站點(diǎn)一般收錄頁(yè)面的幾率會(huì)高很多。對(duì)于收錄頁(yè)面這方面相信很多的站長(zhǎng)都是很清楚,每天百度蜘蛛都在分分秒秒不停地收錄著,但是你會(huì)發(fā)現(xiàn)其實(shí)大部分的站點(diǎn)的收錄都減少了,這是為什么呢?因?yàn)榘俣刃枰^(guò)濾頁(yè)面。
2、過(guò)濾頁(yè)面:
很多頁(yè)面被百度收錄之后,百度認(rèn)為該頁(yè)面對(duì)用戶沒(méi)有太大的價(jià)值,或者是質(zhì)量度比較低的頁(yè)面,百度必然就會(huì)過(guò)濾,這也是用戶體驗(yàn)好的一種表現(xiàn),很多站點(diǎn)以優(yōu)化為目的,絲毫不考慮用戶的體驗(yàn),例如一些橋頁(yè)、跳轉(zhuǎn)頁(yè)面這些就是典型,百度的k站就是一種過(guò)濾頁(yè)面的表現(xiàn),把那些作弊的站點(diǎn)的頁(yè)面全部的過(guò)濾掉。很多人抱怨6.22和6.28百度k站事件,尤其是那些屌絲站長(zhǎng)們整天在論壇抱怨這個(gè)抱怨那個(gè),為什么k你的站,很顯然你的站點(diǎn)真的是以用戶體驗(yàn)為核心運(yùn)營(yíng)站嗎?做SEO的人大多都是為了優(yōu)化而運(yùn)營(yíng)站點(diǎn),每天寫的站內(nèi)的更新、做外鏈肯定一部分是為了優(yōu)化而優(yōu)化,百度k你的站是犧牲少部分人的利益,更多的用戶是從中獲益的,要知道多少人在使用百度,如果搜索出來(lái)的信息是你為了優(yōu)化而運(yùn)營(yíng)的站點(diǎn),低質(zhì)量的頁(yè)面,那百度其實(shí)是拿自己未來(lái)的前途給你優(yōu)化站點(diǎn)做鋪墊的。所以過(guò)濾頁(yè)面這方面百度非常的嚴(yán)格,大家也不要使用seo作弊技術(shù)了。
3、建立索引:
經(jīng)過(guò)了收錄頁(yè)面以及過(guò)濾頁(yè)面的工作之后,百度會(huì)對(duì)這些頁(yè)面逐一進(jìn)行標(biāo)記和識(shí)別,并將這信息進(jìn)行儲(chǔ)存為結(jié)構(gòu)化的數(shù)據(jù),儲(chǔ)存到百度的搜索的服務(wù)器中,這些儲(chǔ)存的數(shù)據(jù)有網(wǎng)頁(yè)的信息、網(wǎng)頁(yè)的標(biāo)題關(guān)鍵詞頁(yè)面描述等標(biāo)簽、網(wǎng)頁(yè)外鏈及描述、抓取記錄。還會(huì)將網(wǎng)頁(yè)中的關(guān)鍵詞信息進(jìn)行識(shí)別和儲(chǔ)存,以便與用戶搜索的內(nèi)容進(jìn)行匹配。建立完善的索引數(shù)據(jù)庫(kù),方便呈現(xiàn)出最佳的顯示信息
4、顯示信息:
用戶輸入的關(guān)鍵詞,百度會(huì)對(duì)其進(jìn)行一系列復(fù)雜的分析,并根據(jù)分析的結(jié)論在索引庫(kù)中尋找與之最為匹配的一系列網(wǎng)頁(yè),按照用戶輸入的關(guān)鍵詞所體現(xiàn)的需求強(qiáng)弱和網(wǎng)頁(yè)的優(yōu)劣進(jìn)行打分,并按照最終的分?jǐn)?shù)進(jìn)行排列,展現(xiàn)給用戶。一般顯示出最佳信息需要是最適合匹配關(guān)鍵詞相關(guān)的頁(yè)面,包括網(wǎng)站站內(nèi)優(yōu)化和網(wǎng)站站外優(yōu)化的因素。