據(jù)了解目前還有10%的公司或者個人站長并不知道什么是網(wǎng)站的LOG日志,還有30%知道網(wǎng)站LOG日志,但是卻從來沒有做過分析的。
??事實上你知道嗎?
??網(wǎng)站的LOG日志就是站點的晴雨表,通過LOG日志的查看,可以精準的了解到網(wǎng)站目前存在的非常多的問題,而放棄了LOG日志的分析,網(wǎng)站規(guī)模越大的網(wǎng)站,則意味著放棄的機會也就越多。
??作為網(wǎng)站負責人,每天看著流量不增長,是什么感受?煎熬!流量為什么不增長?你所理解的SEO還只是做外鏈,發(fā)文章嗎?如果是這樣的話,那么真的只能說是活該了!
??網(wǎng)站有沒有問題,LOG日志文件,精明的站長和企業(yè)都不會忽視他的價值,通過LOG日志的檢查,來發(fā)現(xiàn)那些隱藏在背后的刀芒,今天優(yōu)度項目經(jīng)理就帶大家走進LOG日志的世界。
??一:查看目錄抓取概況
??目錄抓取,可以準確的的查看到不同的蜘蛛爬行過哪些目錄,這些目錄有抓取的必要嗎?在SEO上會有產(chǎn)生的結(jié)果的可能嗎?如果任由抓取,只會浪費蜘蛛給予的抓取配額,和降低對網(wǎng)站質(zhì)量的認可程度。除此之外,通過蜘蛛對目錄的抓取頻率,還可以看住一個目錄的重要性和薄弱點,如果善加利用起來,讓其實現(xiàn)更高和更平衡的抓取頻率,對SEO上的幫助也是極大的,不過真正能把控這一點的人只是極少數(shù)罷了。
??二:查看頁面抓取概況
??頁面抓取可以準確的查看到蜘蛛爬行的每一個頁面,我們通常會見到,有些蜘蛛抓取的頁面居然是網(wǎng)站中前臺看不到的,比如:有人惡意提交一些不存在的動態(tài)鏈接,如:www.xxx.com/?www.qq.com這種類型的鏈接?;蛘哒f,網(wǎng)站雖然做了偽靜態(tài)或者靜態(tài)的處理了,但是蜘蛛為什么抓取到動態(tài)鏈接了呢?這種都是可以通過LOG日志來直接看到的問題,某個頁面抓取頻率越高,通常代表這個頁面更有價值。
??如果你想優(yōu)化的頁面,抓取頻率偏低,那么就要為其增加適當?shù)钠毓舛?,來達成你想要的結(jié)果。
??三:查看狀態(tài)碼信息
??狀態(tài)碼分為兩種,一種是蜘蛛狀態(tài)碼,另一種是用戶狀態(tài)碼,通過蜘蛛狀態(tài)碼可以準確的查看到網(wǎng)站是否存在抓取問題。例如:404代表的是錯誤頁,301、302代表的是重定向,還有一些:504、500、等狀態(tài)碼,值得說的是:除去200狀態(tài)碼,出現(xiàn)其他的狀態(tài)碼都是應當值得注意的,其中最容易出現(xiàn)的可能會是50X以及301、302、304、404這幾個狀態(tài)碼,那么這些狀態(tài)碼是什么含義呢?
??A,50X狀態(tài)碼,X可以是0也可以是2、3、4等數(shù)值,但是這種狀態(tài)碼如果出現(xiàn),通常的問題就是“服務器異?!?,少量偶爾出現(xiàn)沒有任何問題,但是如果大批量的出現(xiàn),或者連續(xù)多天都有此類型的問題,務必要解決,否則100%對網(wǎng)站權(quán)重造成影響,甚至直接導致站點降權(quán)。
??B,40X狀態(tài)碼,這種頁面基本上代表的是頁面無法打開了,可能是權(quán)限問題,也可能是頁面被刪除的問題,我們最容易見到的是404這種“死鏈接”如果大批量出現(xiàn),務必要在百度資源平臺進行死鏈接的主動提交才可以。
??C,301、302狀態(tài)碼,這種可以單獨理解為“跳轉(zhuǎn)”一個頁面跳轉(zhuǎn)到另一個頁面就會產(chǎn)生這種情況,如果站點近期沒有做過特殊操作,卻出現(xiàn)了大量此類型鏈接,務必排查源頭,將其處理為正常的200狀態(tài)碼才可以。
??D,304狀態(tài)碼,量少無任何影響,如果每天出現(xiàn)幾百條或者更多,務必進行處理,大批量的304狀態(tài)碼100%造成網(wǎng)站降權(quán)。
??上面說的是一些LOG日志工具都有的功能,而接下來我們再說一下一些進階類型的東西:
??A:如果想要更多有效的著陸頁被蜘蛛更多的抓取,那么請進行結(jié)構(gòu)內(nèi)鏈的完善,提升需要展現(xiàn)頁面的曝光率。
??B:不希望蜘蛛抓取那些沒有優(yōu)化意義的頁面上,那么robots.txt上來進行封閉,比如一些評論頁、留言頁、或者是不可能出現(xiàn)排名的頁面。
??C:“蜘蛛陷阱”無止盡的循環(huán),浪費抓取配額,通過頁面抓取,都可以直觀看到,常見的通常是“三個條件”的篩選鏈接比如,項目/城市/縣/這樣的3個條件的篩選。
??D:曝光力度夠了,蜘蛛一樣不抓取,只能說頁面價值太低,需要進一步優(yōu)化,頁面價值太低,往往是不同的頁面有用的文字太少了,頁面區(qū)別性太小了造成的。
??E:我們希望每個頁面的下載時間足夠快,可以在有效的時間內(nèi)抓取更多的頁面。
??F:不是所有的蜘蛛都是真的蜘蛛,要學會查看蜘蛛是否為“采集”和“模擬”,如果出現(xiàn)一些如www.xxx.com/zip 這樣的蜘蛛訪問形式,或者是www.xxx.com/admin/conifg這樣的蜘蛛形式,十有八九都是虛假蜘蛛,正常的蜘蛛不會抓取不存在的目錄,有人惡意在掃描網(wǎng)站。
??G:分析每天的蜘蛛,可以查看上升或者下降的趨勢,明顯變化,網(wǎng)站會出事的,當然了這個也可以在百度資源平臺的“抓取頻率”上來進行查看。
H:如果網(wǎng)站規(guī)模較大,服務器經(jīng)常峰值,或者成本太高,那么降低或者封禁不會帶來流量的蜘蛛,以減少服務器壓力,對大型網(wǎng)站很重要,比如:雅虎、有道、微軟,這些亂七八糟的蜘蛛,作用都微乎其微。
好了,這篇文章帶大家熟悉了一下log日志,如果還有不明白的地方,可以打網(wǎng)頁上面的電話咨詢哦!