準(zhǔn)確熟悉SEO做好網(wǎng)站內(nèi)部與外部規(guī)劃 |
發(fā)布時間:2016-01-29 文章來源: 瀏覽次數(shù):3252 |
Robots文件看起來很簡樸,只有幾行字符,但是作為搜索引擎進(jìn)入我們站點(diǎn)后第一個訪問的對象,其扮演的角色確是至關(guān)重要的。這幾行字符中蘊(yùn)含著良多的小細(xì)節(jié)。假如我們忽視這些小細(xì)節(jié)的話,robots文件不僅不能成為站點(diǎn)發(fā)展的踏腳石,更將可能成為影響站點(diǎn)發(fā)展的絆腳石,可以不客氣的說一著不慎,經(jīng)可能滿盤皆輸。下面筆者將在下文中根據(jù)三個案例分析我們寫robots時由于不注重細(xì)節(jié)而引發(fā)的不可承受的“痛”。 題目一:語句的先后順序倒置 我們先來分析一段固然很簡樸,但是被廣泛應(yīng)用的語句: User-agent: * Allow: / Disallow: /1234/ 從這三段robots語句中我們不能看出這原本的書寫目的是要讓搜索引擎不要爬行1234目錄下面的頁面,而其他的頁面則沒有限制。而事實(shí)上這段語句的執(zhí)行效果與我們的目的是背道而馳的,為什么呢?分析后你會發(fā)現(xiàn)搜索引擎蜘蛛對于robots文件的讀取順序是從上到下的,假如你這么寫的話這將會造成屏蔽語句失去原有的效力,修改的方法是將兩者乾坤大挪移,將Disallow: /1234/與Allow: /位置對調(diào)就能實(shí)現(xiàn)我么想要的效果 題目二:屏蔽站點(diǎn)的某一個頁面時,遺漏斜杠“/” 我們也常常使用robots屏蔽某一個敏感的不想搜索引擎爬行的頁面,而在這條語句上我們也有良多細(xì)節(jié)想要留意,舉個例子,如果加入我們想要屏蔽為于根目錄下的登陸頁面login.asp這一頁面,有的站長可能會這么寫:Disallow: login.asp,這乍一看沒什么題目,但是筆者想要問一下你想要屏蔽的這個頁面是位于什么目錄的?是根目錄或者是一級二級目錄的?假如我們忽略前面的斜杠,搜索引擎蜘蛛無法知道該頁面在哪里。修改的方法是:Disallow: /login.asp,這樣才能真正的屏蔽位于根目錄下面的login.asp這一登陸頁面。 題目三:屏蔽站點(diǎn)的整個目錄后,遺漏斜杠“/” 除了屏蔽單個頁面,我想大多數(shù)站長更常使用的是屏蔽整個目錄。同樣舉個案例,好比我們想屏蔽站點(diǎn)的某一個目錄,如/seo/這一目錄下面的頁面,有的人可能會這樣寫Disallow: /seo。這樣寫是否準(zhǔn)確呢?這樣寫不進(jìn)有錯,而且錯很大,造成的危害也很大。我們這樣固然可以屏蔽掉/seo/這一目錄下面的所有想干頁面。但是也會波折到其他不相關(guān)的頁面,這也將屏蔽開頭為/seo的所有頁面。其施展的作用就猶如是Disallow: /seo*。修改的方法很簡樸,即在我們需要屏蔽的目錄名稱后不要漏了斜杠,如Disallow: /seo/。 Robots文件可以保護(hù)我們的站點(diǎn)的一些文件不被搜索引擎抓取,同時也可以晉升搜搜引擎的抓取效率。但是假如我們不留意細(xì)節(jié)的話,不僅得不到效果,還往往會適得其反。但愿本文對于大家在寫robots文件時有所匡助。 |
|